Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];

Вниз

Тоска-печаль   Найти похожие ветки 

 
Германн ©   (2010-02-12 01:18) [40]


> vuk ©   (12.02.10 01:09) [38]


> Просто когда данные были в виде текстовой таблицы, там ячейки
> могли быть многострочными и я сдуру надеялся, что в csv
> такого не будет. Надеялся зря. :)

Это как это?


 
vuk ©   (2010-02-12 01:26) [41]

to Германн ©   (12.02.10 01:18) [40]

> Это как это?


У полей ширина - фиксированная. Если данные не влезают на одну строку, они пишутся в несколько. Не знаю, получится ли это здесь отобразить, но попробую:

|  Поле 1  |      Поле 2      |Поле 3|
+----------+------------------+------+
| xxxxxxxx | тут всякая фигня | xxxxx|
+----------+------------------+------+
| xxxxxxxx | тут тоже фигня,  | xxxxx|
|          | но в одну строку |      |
|          | не уместилась    |      |
+----------+------------------+------+


 
vuk ©   (2010-02-12 01:28) [42]

Нда. Не очень получилось, но если скопировать и вставить в блокнот с моноширинным шрифтом, то будет понятно.


 
Германн ©   (2010-02-12 01:28) [43]

"Раз уж пошла такая пьянка" с файлами csv, то рискну попросить милостыню. :)
Не сможет ли кто, кто умеет, если у него найдется свободная минутка? Нужно вытянуть в файл csv или в любой другой стандартный файл таблицу из таких страниц:
http://www.tutu.ru/rasp.php?st1=80410&st2=79610
http://www.tutu.ru/rasp.php?st1=80410&st2=79610&list=1
http://www.tutu.ru/rasp.php?st1=79610&st2=80410&list=1


 
Германн ©   (2010-02-12 01:34) [44]


> vuk ©   (12.02.10 01:26) [41]


> Не знаю, получится ли это здесь отобразить, но попробую:
>
>


> Нда. Не очень получилось, но если скопировать и вставить
> в блокнот с моноширинным шрифтом, то будет понятно.
>


У меня вроде получилось. И в блокноте то же самое. Явно видна таблица с многострочными ячейками.
Но я про другое спрашивал. Что ты имел в виду, когда говорил "я сдуру надеялся, что в csv такого не будет"?


 
vuk ©   (2010-02-12 01:39) [45]

to Германн ©   (12.02.10 01:34) [44]

> Что ты имел в виду, когда говорил "я сдуру надеялся, что
> в csv такого не будет"?


Надеялся получить по стандарту:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",xxxxx


 
vuk ©   (2010-02-12 01:45) [46]

to Германн ©   (12.02.10 01:28) [43]:

> "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> милостыню. :)

Тут это... Надо парсер HTML писать. Со всеми вытекающими.


 
Германн ©   (2010-02-12 01:54) [47]


> vuk ©   (12.02.10 01:45) [46]
>
> to Германн ©   (12.02.10 01:28) [43]:
>
> > "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> > милостыню. :)
>
> Тут это... Надо парсер HTML писать. Со всеми вытекающими.
>
>

Тогда может быть попрошу милостыню в отдельном вопросе. Но раз это не "минутная работа", то скорее не стану просить.


 
Игорь Шевченко ©   (2010-02-12 01:57) [48]

Excel - рулез


 
Германн ©   (2010-02-12 01:58) [49]


> vuk ©   (12.02.10 01:39) [45]
>
> to Германн ©   (12.02.10 01:34) [44]
>
> > Что ты имел в виду, когда говорил "я сдуру надеялся, что
> > в csv такого не будет"?
>
>
> Надеялся получить по стандарту:
> Поле 1,Поле 2,Поле 3
> xxxxxxxx,тут всякая фигня,xxxxx
> xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",
> xxxxx
>
А есть такой стандарт?

Я считал что стандарт в данном случае будет:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
,"тут тоже фигня,,
,но в одну строку,,
,не уместилась",,


 
Германн ©   (2010-02-12 02:01) [50]


> Игорь Шевченко ©   (12.02.10 01:57) [48]
>
> Excel - рулез
>

Во-во. Именно им и пользуюсь. Но сначала долго и упорно работаю топором. :)
Не все же столько знают и умеют. :)


 
Petr V. Abramov ©   (2010-02-12 02:04) [51]


> vuk ©   (12.02.10 01:26) [41]

>
> У полей ширина - фиксированная. Если данные не влезают на
> одну строку, они пишутся в несколько. Не знаю, получится
> ли это здесь отобразить, но попробую:
>
> |  Поле 1  |      Поле 2      |Поле 3|
> +----------+------------------+------+
> | xxxxxxxx | тут всякая фигня | xxxxx|
> +----------+------------------+------+
> | xxxxxxxx | тут тоже фигня,  | xxxxx|
> |          | но в одну строку |      |
> |          | не уместилась    |      |
> +----------+------------------+------+

< при цитировании съехало> но я понял идею.
ууу дык тут просто ТА технология парсинга, а не ЭТА :)
я, чесснро, говоря, был админом (не разработчиком) ПРИ ЭТОМ, но помню, что народ понимал друг друга с полуслова.
P.S. (полушутка) найми программиста, в требованиях укажи "от 65+ лет, опыт в банке", не на полную ставку, сдельно, на чудацкие форматы. Нормальных, как всегда, не найдешь быстро, но в конце концов проблему решишь.


 
vuk ©   (2010-02-12 02:04) [52]

to Германн ©   (12.02.10 01:58) [49]:

> А есть такой стандарт?

http://ru.wikipedia.org/wiki/CSV


 
vuk ©   (2010-02-12 02:06) [53]

to Petr V. Abramov ©   (12.02.10 02:04) [51]:

> найми программиста

Я пока справляюсь. :P


 
Германн ©   (2010-02-12 02:10) [54]


> vuk ©   (12.02.10 02:04) [52]

1996,Jeep,Grand Cherokee,"MUST SELL!
air, moon roof, loaded",4799.00
Да такого не встречал. Век живи...
Буду знать, если что.


 
Германн ©   (2010-02-12 02:15) [55]


> Германн ©   (12.02.10 02:10) [54]
>
>

Вдогонку. Наверно ту "нестандартную" ерунду писал кто-то вроде меня. Т.е. не специалист, но что-то, где-то знает. Но которого "имеют" как специалиста. :)


 
Игорь Шевченко ©   (2010-02-12 02:21) [56]


> http://ru.wikipedia.org/wiki/CSV


Уродский формат


 
vuk ©   (2010-02-12 02:25) [57]

to Игорь Шевченко ©   (12.02.10 02:21) [56]:

> Уродский формат


Ну, не без этого. Но это лучше, чем красиво оформленные таблицы в тексте.  Я ж говорю, продвинутые применяют формат 1С. Особо продвинутые знают об XML. Но круг узок. Чаще приходится иметь дело как раз с таблицами.


 
Германн ©   (2010-02-12 02:27) [58]

Хм.


 
Германн ©   (2010-02-12 02:28) [59]


> Германн ©   (12.02.10 02:27) [58]

Мой пост был написан до vuk ©   (12.02.10 02:25) [57]


 
Petr V. Abramov ©   (2010-02-12 02:30) [60]


> vuk ©   (12.02.10 02:06) [53]
>
> to Petr V. Abramov ©   (12.02.10 02:04) [51]:
>
> > найми программиста
>
> Я пока справляюсь. :P

дык я тоже коромысло донесу и безвыходное положение заставит  еще че зделаю. Но у специально обученнго человека лучше выйдет и дешевле.
:)


 
Германн ©   (2010-02-12 02:34) [61]


> Petr V. Abramov ©   (12.02.10 02:30) [60]

Ищешь работу? :)


 
Игорь Шевченко ©   (2010-02-12 02:58) [62]

vuk ©   (12.02.10 02:25) [57]

"В сущности, CSV представляет собой азбучный пример того, как не следует проектировать текстовый формат. Проблемы, связанные с ним, начинаются с ситуации, когда разделяющий символ (в данном случае, запятая), находится внутри поля. В Unix в таком случае для буквального представления разделителя перед ним был бы вставлен символ обратной косой черты, а буквальная обратная косая черта представлялась бы при помощи двойной обратной косой черты. Такая конструкция создает единственный частный случай (знак переключения), который необходимо проверять во время синтаксического анализа файла, и требует единственного действия, когда такой символ найден, а именно - интерпретировать следующий символ буквально. Данное действие не только обрабатывает разделяющий символ, но и предствляет способ обработки знака переключения и символов новой строки без дополнительных ухищрений. С другой стороны, в формате CSV целое поле заключается в двойные кавычки, в случае, если оно содержит символ-разделитель. Если поле содержит двойные кавычки, его также необходимо заключать в двойные кавычки, а отдельные двойные кавычки в поле необходимо повторять дважды, для того, чтобы указать, что они не завершают поле.
Существует два негативных результата роста числа частных случаев. Во-первых, возрастает сложность синтаксического анализатора (и его чувствительность к ошибкам). Во-вторых, ввиду того, что правила формата сложны и непредусмотрены, различные реализации расходятся в обработке граничных случаев. Иногда продолжающиеся строки поддерживаются путем начала последнего поля строки с незакрытых двойных кавычек, но только в некоторых продуктах."


 
Petr V. Abramov ©   (2010-02-12 03:17) [63]


> Игорь Шевченко ©   (12.02.10 02:58) [62]

ну в общем случае любой формат - ацтой.
а когда в файле - числа и строки, причем строки - не цитаты из войны и мира, а названия электроплит, - формат ПРЕКРАСНЫЙ.


 
Petr V. Abramov ©   (2010-02-12 05:41) [64]


> Германн ©   (12.02.10 02:34) [61]

на твоей народ жажда одолевает?
:)


 
KSergey ©   (2010-02-12 09:00) [65]

> Германн ©   (12.02.10 01:28) [43]

Нужно "круто и гибко" или "чтобы работало"?
Ну я на что намякиваю: сделать под конкретный случай.. ну не парсер, а пережевывалку - легко.
Но вот "чтобы всегда работало и легко перестраивалось под новые форматы" (исли страницу переверстают) - сложно, понятно.

Как надо?


 
Anatoly Podgoretsky ©   (2010-02-12 09:08) [66]

> vuk  (12.02.2010 00:49:34)  [34]

Ну тупые.


 
Германн ©   (2010-02-12 12:02) [67]


> KSergey ©   (12.02.10 09:00) [65]
>
> > Германн ©   (12.02.10 01:28) [43]
>
> Нужно "круто и гибко" или "чтобы работало"?
> Ну я на что намякиваю: сделать под конкретный случай.. ну
> не парсер, а пережевывалку - легко.
> Но вот "чтобы всегда работало и легко перестраивалось под
> новые форматы" (исли страницу переверстают) - сложно, понятно.
>
>
> Как надо?
>

"Под конкретный случай".


 
12 ©   (2010-02-12 13:42) [68]


> Германн ©   (12.02.10 01:28) [43]

s:=IdHTTP1.Get("http://www.tutu.ru/rasp.php?st1=80410&st2=79610");
и pos в руки ..
"лучше 5 дней потерять" (c)
Там не меняется походу уже года 2



Страницы: 1 2 вся ветка

Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];

Наверх




Память: 0.59 MB
Время: 0.081 c
2-1274637112
Semen
2010-05-23 21:51
2010.08.27
Вывести сообщение при загрузке Windows


15-1273641886
Дмитрий С
2010-05-12 09:24
2010.08.27
Что большее зло: goto или while true do ?


2-1268839389
Knob
2010-03-17 18:23
2010.08.27
Командная строка


15-1271655951
Дрогба
2010-04-19 09:45
2010.08.27
Хороший программист


2-1268927982
DROWSY
2010-03-18 18:59
2010.08.27
Набор редактируется в гриде.





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский