Главная страница
Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.08.27;
Скачать: CL | DM;

Вниз

Тоска-печаль   Найти похожие ветки 

 
Германн ©   (2010-02-12 01:18) [40]


> vuk ©   (12.02.10 01:09) [38]


> Просто когда данные были в виде текстовой таблицы, там ячейки
> могли быть многострочными и я сдуру надеялся, что в csv
> такого не будет. Надеялся зря. :)

Это как это?


 
vuk ©   (2010-02-12 01:26) [41]

to Германн ©   (12.02.10 01:18) [40]

> Это как это?


У полей ширина - фиксированная. Если данные не влезают на одну строку, они пишутся в несколько. Не знаю, получится ли это здесь отобразить, но попробую:

|  Поле 1  |      Поле 2      |Поле 3|
+----------+------------------+------+
| xxxxxxxx | тут всякая фигня | xxxxx|
+----------+------------------+------+
| xxxxxxxx | тут тоже фигня,  | xxxxx|
|          | но в одну строку |      |
|          | не уместилась    |      |
+----------+------------------+------+


 
vuk ©   (2010-02-12 01:28) [42]

Нда. Не очень получилось, но если скопировать и вставить в блокнот с моноширинным шрифтом, то будет понятно.


 
Германн ©   (2010-02-12 01:28) [43]

"Раз уж пошла такая пьянка" с файлами csv, то рискну попросить милостыню. :)
Не сможет ли кто, кто умеет, если у него найдется свободная минутка? Нужно вытянуть в файл csv или в любой другой стандартный файл таблицу из таких страниц:
http://www.tutu.ru/rasp.php?st1=80410&st2=79610
http://www.tutu.ru/rasp.php?st1=80410&st2=79610&list=1
http://www.tutu.ru/rasp.php?st1=79610&st2=80410&list=1


 
Германн ©   (2010-02-12 01:34) [44]


> vuk ©   (12.02.10 01:26) [41]


> Не знаю, получится ли это здесь отобразить, но попробую:
>
>


> Нда. Не очень получилось, но если скопировать и вставить
> в блокнот с моноширинным шрифтом, то будет понятно.
>


У меня вроде получилось. И в блокноте то же самое. Явно видна таблица с многострочными ячейками.
Но я про другое спрашивал. Что ты имел в виду, когда говорил "я сдуру надеялся, что в csv такого не будет"?


 
vuk ©   (2010-02-12 01:39) [45]

to Германн ©   (12.02.10 01:34) [44]

> Что ты имел в виду, когда говорил "я сдуру надеялся, что
> в csv такого не будет"?


Надеялся получить по стандарту:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",xxxxx


 
vuk ©   (2010-02-12 01:45) [46]

to Германн ©   (12.02.10 01:28) [43]:

> "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> милостыню. :)

Тут это... Надо парсер HTML писать. Со всеми вытекающими.


 
Германн ©   (2010-02-12 01:54) [47]


> vuk ©   (12.02.10 01:45) [46]
>
> to Германн ©   (12.02.10 01:28) [43]:
>
> > "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> > милостыню. :)
>
> Тут это... Надо парсер HTML писать. Со всеми вытекающими.
>
>

Тогда может быть попрошу милостыню в отдельном вопросе. Но раз это не "минутная работа", то скорее не стану просить.


 
Игорь Шевченко ©   (2010-02-12 01:57) [48]

Excel - рулез


 
Германн ©   (2010-02-12 01:58) [49]


> vuk ©   (12.02.10 01:39) [45]
>
> to Германн ©   (12.02.10 01:34) [44]
>
> > Что ты имел в виду, когда говорил "я сдуру надеялся, что
> > в csv такого не будет"?
>
>
> Надеялся получить по стандарту:
> Поле 1,Поле 2,Поле 3
> xxxxxxxx,тут всякая фигня,xxxxx
> xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",
> xxxxx
>
А есть такой стандарт?

Я считал что стандарт в данном случае будет:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
,"тут тоже фигня,,
,но в одну строку,,
,не уместилась",,


 
Германн ©   (2010-02-12 02:01) [50]


> Игорь Шевченко ©   (12.02.10 01:57) [48]
>
> Excel - рулез
>

Во-во. Именно им и пользуюсь. Но сначала долго и упорно работаю топором. :)
Не все же столько знают и умеют. :)


 
Petr V. Abramov ©   (2010-02-12 02:04) [51]


> vuk ©   (12.02.10 01:26) [41]

>
> У полей ширина - фиксированная. Если данные не влезают на
> одну строку, они пишутся в несколько. Не знаю, получится
> ли это здесь отобразить, но попробую:
>
> |  Поле 1  |      Поле 2      |Поле 3|
> +----------+------------------+------+
> | xxxxxxxx | тут всякая фигня | xxxxx|
> +----------+------------------+------+
> | xxxxxxxx | тут тоже фигня,  | xxxxx|
> |          | но в одну строку |      |
> |          | не уместилась    |      |
> +----------+------------------+------+

< при цитировании съехало> но я понял идею.
ууу дык тут просто ТА технология парсинга, а не ЭТА :)
я, чесснро, говоря, был админом (не разработчиком) ПРИ ЭТОМ, но помню, что народ понимал друг друга с полуслова.
P.S. (полушутка) найми программиста, в требованиях укажи "от 65+ лет, опыт в банке", не на полную ставку, сдельно, на чудацкие форматы. Нормальных, как всегда, не найдешь быстро, но в конце концов проблему решишь.


 
vuk ©   (2010-02-12 02:04) [52]

to Германн ©   (12.02.10 01:58) [49]:

> А есть такой стандарт?

http://ru.wikipedia.org/wiki/CSV


 
vuk ©   (2010-02-12 02:06) [53]

to Petr V. Abramov ©   (12.02.10 02:04) [51]:

> найми программиста

Я пока справляюсь. :P


 
Германн ©   (2010-02-12 02:10) [54]


> vuk ©   (12.02.10 02:04) [52]

1996,Jeep,Grand Cherokee,"MUST SELL!
air, moon roof, loaded",4799.00
Да такого не встречал. Век живи...
Буду знать, если что.


 
Германн ©   (2010-02-12 02:15) [55]


> Германн ©   (12.02.10 02:10) [54]
>
>

Вдогонку. Наверно ту "нестандартную" ерунду писал кто-то вроде меня. Т.е. не специалист, но что-то, где-то знает. Но которого "имеют" как специалиста. :)


 
Игорь Шевченко ©   (2010-02-12 02:21) [56]


> http://ru.wikipedia.org/wiki/CSV


Уродский формат


 
vuk ©   (2010-02-12 02:25) [57]

to Игорь Шевченко ©   (12.02.10 02:21) [56]:

> Уродский формат


Ну, не без этого. Но это лучше, чем красиво оформленные таблицы в тексте.  Я ж говорю, продвинутые применяют формат 1С. Особо продвинутые знают об XML. Но круг узок. Чаще приходится иметь дело как раз с таблицами.


 
Германн ©   (2010-02-12 02:27) [58]

Хм.


 
Германн ©   (2010-02-12 02:28) [59]


> Германн ©   (12.02.10 02:27) [58]

Мой пост был написан до vuk ©   (12.02.10 02:25) [57]


 
Petr V. Abramov ©   (2010-02-12 02:30) [60]


> vuk ©   (12.02.10 02:06) [53]
>
> to Petr V. Abramov ©   (12.02.10 02:04) [51]:
>
> > найми программиста
>
> Я пока справляюсь. :P

дык я тоже коромысло донесу и безвыходное положение заставит  еще че зделаю. Но у специально обученнго человека лучше выйдет и дешевле.
:)


 
Германн ©   (2010-02-12 02:34) [61]


> Petr V. Abramov ©   (12.02.10 02:30) [60]

Ищешь работу? :)


 
Игорь Шевченко ©   (2010-02-12 02:58) [62]

vuk ©   (12.02.10 02:25) [57]

"В сущности, CSV представляет собой азбучный пример того, как не следует проектировать текстовый формат. Проблемы, связанные с ним, начинаются с ситуации, когда разделяющий символ (в данном случае, запятая), находится внутри поля. В Unix в таком случае для буквального представления разделителя перед ним был бы вставлен символ обратной косой черты, а буквальная обратная косая черта представлялась бы при помощи двойной обратной косой черты. Такая конструкция создает единственный частный случай (знак переключения), который необходимо проверять во время синтаксического анализа файла, и требует единственного действия, когда такой символ найден, а именно - интерпретировать следующий символ буквально. Данное действие не только обрабатывает разделяющий символ, но и предствляет способ обработки знака переключения и символов новой строки без дополнительных ухищрений. С другой стороны, в формате CSV целое поле заключается в двойные кавычки, в случае, если оно содержит символ-разделитель. Если поле содержит двойные кавычки, его также необходимо заключать в двойные кавычки, а отдельные двойные кавычки в поле необходимо повторять дважды, для того, чтобы указать, что они не завершают поле.
Существует два негативных результата роста числа частных случаев. Во-первых, возрастает сложность синтаксического анализатора (и его чувствительность к ошибкам). Во-вторых, ввиду того, что правила формата сложны и непредусмотрены, различные реализации расходятся в обработке граничных случаев. Иногда продолжающиеся строки поддерживаются путем начала последнего поля строки с незакрытых двойных кавычек, но только в некоторых продуктах."


 
Petr V. Abramov ©   (2010-02-12 03:17) [63]


> Игорь Шевченко ©   (12.02.10 02:58) [62]

ну в общем случае любой формат - ацтой.
а когда в файле - числа и строки, причем строки - не цитаты из войны и мира, а названия электроплит, - формат ПРЕКРАСНЫЙ.


 
Petr V. Abramov ©   (2010-02-12 05:41) [64]


> Германн ©   (12.02.10 02:34) [61]

на твоей народ жажда одолевает?
:)


 
KSergey ©   (2010-02-12 09:00) [65]

> Германн ©   (12.02.10 01:28) [43]

Нужно "круто и гибко" или "чтобы работало"?
Ну я на что намякиваю: сделать под конкретный случай.. ну не парсер, а пережевывалку - легко.
Но вот "чтобы всегда работало и легко перестраивалось под новые форматы" (исли страницу переверстают) - сложно, понятно.

Как надо?


 
Anatoly Podgoretsky ©   (2010-02-12 09:08) [66]

> vuk  (12.02.2010 00:49:34)  [34]

Ну тупые.


 
Германн ©   (2010-02-12 12:02) [67]


> KSergey ©   (12.02.10 09:00) [65]
>
> > Германн ©   (12.02.10 01:28) [43]
>
> Нужно "круто и гибко" или "чтобы работало"?
> Ну я на что намякиваю: сделать под конкретный случай.. ну
> не парсер, а пережевывалку - легко.
> Но вот "чтобы всегда работало и легко перестраивалось под
> новые форматы" (исли страницу переверстают) - сложно, понятно.
>
>
> Как надо?
>

"Под конкретный случай".


 
12 ©   (2010-02-12 13:42) [68]


> Германн ©   (12.02.10 01:28) [43]

s:=IdHTTP1.Get("http://www.tutu.ru/rasp.php?st1=80410&st2=79610");
и pos в руки ..
"лучше 5 дней потерять" (c)
Там не меняется походу уже года 2



Страницы: 1 2 вся ветка

Текущий архив: 2010.08.27;
Скачать: CL | DM;

Наверх




Память: 0.61 MB
Время: 0.063 c
4-1230942499
Fighter
2009-01-03 03:28
2010.08.27
Как получить серийный номер USB флешки (UniqueID)


2-1268459445
dj kondakov
2010-03-13 08:50
2010.08.27
Глюк с отображением вкладок PageControl a


15-1262219675
Petr V. Abramov
2009-12-31 03:34
2010.08.27
закрывается Игналинская АЭС


15-1265664604
Юрий
2010-02-09 00:30
2010.08.27
С днем рождения ! 9 февраля 2010 вторник


15-1270794656
Den
2010-04-09 10:30
2010.08.27
Тип дистрибутива