Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];
ВнизТоска-печаль Найти похожие ветки
← →
Германн © (2010-02-12 01:18) [40]
> vuk © (12.02.10 01:09) [38]
> Просто когда данные были в виде текстовой таблицы, там ячейки
> могли быть многострочными и я сдуру надеялся, что в csv
> такого не будет. Надеялся зря. :)
Это как это?
← →
vuk © (2010-02-12 01:26) [41]to Германн © (12.02.10 01:18) [40]
> Это как это?
У полей ширина - фиксированная. Если данные не влезают на одну строку, они пишутся в несколько. Не знаю, получится ли это здесь отобразить, но попробую:| Поле 1 | Поле 2 |Поле 3|
+----------+------------------+------+
| xxxxxxxx | тут всякая фигня | xxxxx|
+----------+------------------+------+
| xxxxxxxx | тут тоже фигня, | xxxxx|
| | но в одну строку | |
| | не уместилась | |
+----------+------------------+------+
← →
vuk © (2010-02-12 01:28) [42]Нда. Не очень получилось, но если скопировать и вставить в блокнот с моноширинным шрифтом, то будет понятно.
← →
Германн © (2010-02-12 01:28) [43]"Раз уж пошла такая пьянка" с файлами csv, то рискну попросить милостыню. :)
Не сможет ли кто, кто умеет, если у него найдется свободная минутка? Нужно вытянуть в файл csv или в любой другой стандартный файл таблицу из таких страниц:
http://www.tutu.ru/rasp.php?st1=80410&st2=79610
http://www.tutu.ru/rasp.php?st1=80410&st2=79610&list=1
http://www.tutu.ru/rasp.php?st1=79610&st2=80410&list=1
← →
Германн © (2010-02-12 01:34) [44]
> vuk © (12.02.10 01:26) [41]
> Не знаю, получится ли это здесь отобразить, но попробую:
>
>
> Нда. Не очень получилось, но если скопировать и вставить
> в блокнот с моноширинным шрифтом, то будет понятно.
>
У меня вроде получилось. И в блокноте то же самое. Явно видна таблица с многострочными ячейками.
Но я про другое спрашивал. Что ты имел в виду, когда говорил "я сдуру надеялся, что в csv такого не будет"?
← →
vuk © (2010-02-12 01:39) [45]to Германн © (12.02.10 01:34) [44]
> Что ты имел в виду, когда говорил "я сдуру надеялся, что
> в csv такого не будет"?
Надеялся получить по стандарту:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",xxxxx
← →
vuk © (2010-02-12 01:45) [46]to Германн © (12.02.10 01:28) [43]:
> "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> милостыню. :)
Тут это... Надо парсер HTML писать. Со всеми вытекающими.
← →
Германн © (2010-02-12 01:54) [47]
> vuk © (12.02.10 01:45) [46]
>
> to Германн © (12.02.10 01:28) [43]:
>
> > "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> > милостыню. :)
>
> Тут это... Надо парсер HTML писать. Со всеми вытекающими.
>
>
Тогда может быть попрошу милостыню в отдельном вопросе. Но раз это не "минутная работа", то скорее не стану просить.
← →
Игорь Шевченко © (2010-02-12 01:57) [48]Excel - рулез
← →
Германн © (2010-02-12 01:58) [49]
> vuk © (12.02.10 01:39) [45]
>
> to Германн © (12.02.10 01:34) [44]
>
> > Что ты имел в виду, когда говорил "я сдуру надеялся, что
> > в csv такого не будет"?
>
>
> Надеялся получить по стандарту:
> Поле 1,Поле 2,Поле 3
> xxxxxxxx,тут всякая фигня,xxxxx
> xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",
> xxxxx
>
А есть такой стандарт?
Я считал что стандарт в данном случае будет:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
,"тут тоже фигня,,
,но в одну строку,,
,не уместилась",,
← →
Германн © (2010-02-12 02:01) [50]
> Игорь Шевченко © (12.02.10 01:57) [48]
>
> Excel - рулез
>
Во-во. Именно им и пользуюсь. Но сначала долго и упорно работаю топором. :)
Не все же столько знают и умеют. :)
← →
Petr V. Abramov © (2010-02-12 02:04) [51]
> vuk © (12.02.10 01:26) [41]
>
> У полей ширина - фиксированная. Если данные не влезают на
> одну строку, они пишутся в несколько. Не знаю, получится
> ли это здесь отобразить, но попробую:
>
> | Поле 1 | Поле 2 |Поле 3|
> +----------+------------------+------+
> | xxxxxxxx | тут всякая фигня | xxxxx|
> +----------+------------------+------+
> | xxxxxxxx | тут тоже фигня, | xxxxx|
> | | но в одну строку | |
> | | не уместилась | |
> +----------+------------------+------+
< при цитировании съехало> но я понял идею.
ууу дык тут просто ТА технология парсинга, а не ЭТА :)
я, чесснро, говоря, был админом (не разработчиком) ПРИ ЭТОМ, но помню, что народ понимал друг друга с полуслова.
P.S. (полушутка) найми программиста, в требованиях укажи "от 65+ лет, опыт в банке", не на полную ставку, сдельно, на чудацкие форматы. Нормальных, как всегда, не найдешь быстро, но в конце концов проблему решишь.
← →
vuk © (2010-02-12 02:04) [52]to Германн © (12.02.10 01:58) [49]:
> А есть такой стандарт?
http://ru.wikipedia.org/wiki/CSV
← →
vuk © (2010-02-12 02:06) [53]to Petr V. Abramov © (12.02.10 02:04) [51]:
> найми программиста
Я пока справляюсь. :P
← →
Германн © (2010-02-12 02:10) [54]
> vuk © (12.02.10 02:04) [52]
1996,Jeep,Grand Cherokee,"MUST SELL!
air, moon roof, loaded",4799.00
Да такого не встречал. Век живи...
Буду знать, если что.
← →
Германн © (2010-02-12 02:15) [55]
> Германн © (12.02.10 02:10) [54]
>
>
Вдогонку. Наверно ту "нестандартную" ерунду писал кто-то вроде меня. Т.е. не специалист, но что-то, где-то знает. Но которого "имеют" как специалиста. :)
← →
Игорь Шевченко © (2010-02-12 02:21) [56]
> http://ru.wikipedia.org/wiki/CSV
Уродский формат
← →
vuk © (2010-02-12 02:25) [57]to Игорь Шевченко © (12.02.10 02:21) [56]:
> Уродский формат
Ну, не без этого. Но это лучше, чем красиво оформленные таблицы в тексте. Я ж говорю, продвинутые применяют формат 1С. Особо продвинутые знают об XML. Но круг узок. Чаще приходится иметь дело как раз с таблицами.
← →
Германн © (2010-02-12 02:27) [58]Хм.
← →
Германн © (2010-02-12 02:28) [59]
> Германн © (12.02.10 02:27) [58]
Мой пост был написан до vuk © (12.02.10 02:25) [57]
← →
Petr V. Abramov © (2010-02-12 02:30) [60]
> vuk © (12.02.10 02:06) [53]
>
> to Petr V. Abramov © (12.02.10 02:04) [51]:
>
> > найми программиста
>
> Я пока справляюсь. :P
дык я тоже коромысло донесу и безвыходное положение заставит еще че зделаю. Но у специально обученнго человека лучше выйдет и дешевле.
:)
← →
Германн © (2010-02-12 02:34) [61]
> Petr V. Abramov © (12.02.10 02:30) [60]
Ищешь работу? :)
← →
Игорь Шевченко © (2010-02-12 02:58) [62]vuk © (12.02.10 02:25) [57]
"В сущности, CSV представляет собой азбучный пример того, как не следует проектировать текстовый формат. Проблемы, связанные с ним, начинаются с ситуации, когда разделяющий символ (в данном случае, запятая), находится внутри поля. В Unix в таком случае для буквального представления разделителя перед ним был бы вставлен символ обратной косой черты, а буквальная обратная косая черта представлялась бы при помощи двойной обратной косой черты. Такая конструкция создает единственный частный случай (знак переключения), который необходимо проверять во время синтаксического анализа файла, и требует единственного действия, когда такой символ найден, а именно - интерпретировать следующий символ буквально. Данное действие не только обрабатывает разделяющий символ, но и предствляет способ обработки знака переключения и символов новой строки без дополнительных ухищрений. С другой стороны, в формате CSV целое поле заключается в двойные кавычки, в случае, если оно содержит символ-разделитель. Если поле содержит двойные кавычки, его также необходимо заключать в двойные кавычки, а отдельные двойные кавычки в поле необходимо повторять дважды, для того, чтобы указать, что они не завершают поле.
Существует два негативных результата роста числа частных случаев. Во-первых, возрастает сложность синтаксического анализатора (и его чувствительность к ошибкам). Во-вторых, ввиду того, что правила формата сложны и непредусмотрены, различные реализации расходятся в обработке граничных случаев. Иногда продолжающиеся строки поддерживаются путем начала последнего поля строки с незакрытых двойных кавычек, но только в некоторых продуктах."
← →
Petr V. Abramov © (2010-02-12 03:17) [63]
> Игорь Шевченко © (12.02.10 02:58) [62]
ну в общем случае любой формат - ацтой.
а когда в файле - числа и строки, причем строки - не цитаты из войны и мира, а названия электроплит, - формат ПРЕКРАСНЫЙ.
← →
Petr V. Abramov © (2010-02-12 05:41) [64]
> Германн © (12.02.10 02:34) [61]
на твоей народ жажда одолевает?
:)
← →
KSergey © (2010-02-12 09:00) [65]> Германн © (12.02.10 01:28) [43]
Нужно "круто и гибко" или "чтобы работало"?
Ну я на что намякиваю: сделать под конкретный случай.. ну не парсер, а пережевывалку - легко.
Но вот "чтобы всегда работало и легко перестраивалось под новые форматы" (исли страницу переверстают) - сложно, понятно.
Как надо?
← →
Anatoly Podgoretsky © (2010-02-12 09:08) [66]> vuk (12.02.2010 00:49:34) [34]
Ну тупые.
← →
Германн © (2010-02-12 12:02) [67]
> KSergey © (12.02.10 09:00) [65]
>
> > Германн © (12.02.10 01:28) [43]
>
> Нужно "круто и гибко" или "чтобы работало"?
> Ну я на что намякиваю: сделать под конкретный случай.. ну
> не парсер, а пережевывалку - легко.
> Но вот "чтобы всегда работало и легко перестраивалось под
> новые форматы" (исли страницу переверстают) - сложно, понятно.
>
>
> Как надо?
>
"Под конкретный случай".
← →
12 © (2010-02-12 13:42) [68]
> Германн © (12.02.10 01:28) [43]
s:=IdHTTP1.Get("http://www.tutu.ru/rasp.php?st1=80410&st2=79610");
и pos в руки ..
"лучше 5 дней потерять" (c)
Там не меняется походу уже года 2
Страницы: 1 2 вся ветка
Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];
Память: 0.59 MB
Время: 0.066 c