Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];
ВнизТоска-печаль Найти похожие ветки
← →
Медвежонок Пятачок © (2010-02-10 18:51) [0]приходит письмо.
некое федеральное бюро предлагает нам дружить в электронном виде.
к письму прилагаются тексты договоров, приложения регламенты и прочая дребедень.
дружить с бюром можно купив у них программу (цена от 50 до 300 тыс. руб в зависимости от версии), либо написать ее самому.
бум разумеется писать свою, ибо "нефик нас дурить, мы не отдыхающие".
открываю спецификацию, имея уже легкое предчувствие.
Начало документа. Четыре страницы - история эволюции велосипеда (формата сообщений)
тектовый формат, маркеры, смещения, правила повторений, правила исключений повторений если четверг, но луна в козероге во время дождя .......
Версия 1.0 (июль) "начало пути"
первое изменение:
Версия 1.08 (8 августа того же года)
1. Увеличена длина поля X в сегменте Y до N1 символов
2. Увеличена длина поля Z в сегменте X до N2 символов
3. Введен новый тип поля (Signed numeric), допускающий присутствие знаков «+» и «-».
И печаль обуяла меня.......
Автоматизация в РФ неизбежна как победа коммунизма
← →
GDI+ (2010-02-10 20:16) [1]
> Автоматизация в РФ неизбежна как победа коммунизма
Это ирония, или?
То что там спецификации разрабатывают студенты, а откаты чиновники, надеюсь, ни для кого не новость.
Можете предложить свои услуги по созданию спецификации, попробуйте позвонить и проконсультироваться с разработчиками. Бесплатную помощь для разработки спецификации и библиотек они с радостью примут, и вам оно проще и дешевле обойдётся.
← →
GDI+ (2010-02-10 20:16) [2]Пишу, так как сам со стороны государства работал над подобным.
← →
TUser © (2010-02-10 20:24) [3]Спецификацию дали, а ты еще и недоволен. Вот если бы без спецификации, ... а так вапще щитай цивилизация. Нарпимер, так. Шлем данные куда-то в любом формате, в ответ получаем - принято или нет. Если нет, то штраф - 1000% от прибыли в назедание потомкам. Исественный атбор ))
← →
Anatoly Podgoretsky © (2010-02-10 20:43) [4]О и работать не обязательно, только успевай не принимать.
← →
AlexDan © (2010-02-10 21:57) [5]что-то я не понял в чём дружба, по моему этому бюро главное продать программу за от 50 до 300 тыс. руб, и всё остальное им пофигу.. т.е. лохотрон замаскированный под сотрудничество..
← →
Petr V. Abramov © (2010-02-10 22:54) [6]
> AlexDan © (10.02.10 21:57) [5]
да
> То что там спецификации разрабатывают студенты, а откаты
> чиновники, надеюсь, ни для кого не новость.
>
нет, студенту это нельзя доверять, студент может разработать так, что самому написать проще, чем купить
> от 50 до 300 тыс. руб в зависимости от версии
поэтому спецификации разрабатывают люди опытные, а реализацией как раз студенты занимаются.
← →
Anatoly Podgoretsky © (2010-02-10 23:19) [7]> Petr V. Abramov (10.02.2010 22:54:06) [6]
А если ЕГАИС, в обязательном порядке.
← →
KilkennyCat © (2010-02-10 23:51) [8]Если кому спецификацию разработать, да так, чтоб психушка переполнилась - велкам!
← →
Медвежонок Пятачок © (2010-02-11 09:10) [9]поэтому спецификации разрабатывают люди опытные
Ну разумеется. Опытные.
Они еще и мудрые судя по тому, что вводят новый тип данных спустя всего месяц с момента как у них было первое откровение. И главное какой тип. Опытные чуваки вспомнили, что числа бывают отрицательные.
3. Введен новый тип поля (Signed numeric), допускающий присутствие знаков «+» и «-».
← →
KSergey © (2010-02-11 09:19) [10]Как приятно все же познавать мир! Столько чудесного об окружающей действительности узнаёшь!
Завидую даже где-то.
← →
@!!ex © (2010-02-11 09:23) [11]> [5] AlexDan © (10.02.10 21:57)
Это стеб, если что. ;)
Речь о какой нибудь налоговой...
← →
Медвежонок Пятачок © (2010-02-11 11:23) [12]Для тех кто не не понял шутки юмора (ну вдруг):
Опытные чуваки придумали формат файла.
В нем маркеры, смещения, номера строк.
И скажем есть атрибут "некая сумма"
согласно ихней мудрости этот атрибут должен стоять в определенной строке файла и в определенной позиции этой строки.
Мудрецам этого кажется мало.
Они провозглашают, что атрибут этот имеет тип "N".
Придумывают для него правило "Должен состоять из символов - цифр"
Те есть перед значением атрибута следует спецификатор типа "N"
Через месяц до них доходит, что сумма может быть отрицательной.
Что они делают:
Вводят тип "SN" (знаковое числительное)
И смягчают для него правило "состоять из цифр, но первым символом может быть + или -"
И теперь в определенной строке файла и в определенной позиции этой строки стоит уже SN-1000
Как говорится зацените полет мысли архитектора.
← →
картман © (2010-02-11 11:49) [13]
> Медвежонок Пятачок © (11.02.10 11:23) [12]
не томи душу, расскажи уже, что за контора такая(сфера деятельности)?
← →
KSergey © (2010-02-11 12:35) [14]Я вот честно не понимаю о чем грусть-печаль
Может я один из них?
Ну плохо подумали, и че? сделали непротиворечивое расширение, в чем беда?
← →
KSergey © (2010-02-11 12:45) [15]к стати, а дробных чисел тама точно не предвидится? :)
← →
KilkennyCat © (2010-02-11 14:32) [16]да, любопытно, как они опишут дробь. как вариант: D52SN-1000 где 52 - дробная часть
← →
KSergey © (2010-02-11 15:51) [17]> KilkennyCat © (11.02.10 14:32) [16]
Файтазер :)
Впрочем, "у них" есть мощное уродие: номер строки и местополжение в ней.
Так чт ничто не мешает дробную часть написать в любой другой строке, в любой позиции.
← →
Andy BitOff © (2010-02-11 15:54) [18]
> KSergey © (11.02.10 15:51) [17]
> мощное уродие
=))
← →
имя (2010-02-11 16:36) [19]Удалено модератором
← →
12 © (2010-02-11 16:51) [20]Удалено модератором
← →
KSergey © (2010-02-11 17:18) [21]> Andy BitOff © (11.02.10 15:54) [18]
Да, описька знатная вышла. Увидел после, править не стал, и так хорошо выглядит.
> GDI+ (11.02.10 16:36) [19]
Ась?
← →
имя (2010-02-11 17:19) [22]Удалено модератором
← →
Игорь Шевченко © (2010-02-11 17:20) [23]
> Для тех кто не не понял шутки юмора
Я до сих пор не понял.
> Как говорится зацените полет мысли архитектора.
Нормальный полет. Ты не видел международных форматов.
← →
KSergey © (2010-02-11 17:22) [24]Удалено модератором
← →
Petr V. Abramov © (2010-02-11 17:24) [25]Удалено модератором
← →
KSergey © (2010-02-11 17:24) [26]Удалено модератором
← →
vuk © (2010-02-11 17:41) [27]Ойблин... А какие иногда из банков документы по системам клиент-банк приходят! Иной раз складывается впечатление, что то, что эти документы генерит, писали не люди, а какие-то мифические животные, навроде говорящих оленей.
Верх мысли эти существа с неестественным интеллектом проявили однажды, когда при подключении очередного банка их попросили прислать варианты документов, которые их софтина может выдавать. Там, чаще всего, бывает текстовый файл, в котором нафигачена таблица - с оформлением с помощью символов |,-,+,= и т.п. У особо продвинутых формат обмена от 1С, это можно считать за счастье, т.к. он четко описан и парсится на раз. А тут вдруг среди прочего вижу файл с расширением csv. Обрадовался, было, ну, думаю, вот это мы сейчас мигом распарсим. Агащаз. В файле, конечно, разделители есть, но значениями являются еще и элементы офромления таблицы.
Ну, то есть строка вместо, например, такого вида1,2,3,4
имеет вид:|,1,|,2,|,3,|,4
← →
KSergey © (2010-02-11 17:57) [28]> vuk © (11.02.10 17:41) [27]
> имеет вид:
> |,1,|,2,|,3,|,4
вполне честный csv считаю
← →
vuk © (2010-02-11 17:59) [29]to KSergey © (11.02.10 17:57) [28]:
> вполне честный csv считаю
Да кто ж спорит, что он честный? Никто не спорит. :)
← →
turbouser © (2010-02-11 21:55) [30]Года два назад последний раз имел дело с госконторами, так все форматы обмена обсуждали вместе.. да и не только.. Сейчас, насколько знаю все поменялось - тоже спускают сверЪху и все..
← →
Petr V. Abramov © (2010-02-11 23:21) [31]
> vuk © (11.02.10 17:41) [27]
все эти форматы обмена придумали в середине 90-х, и, скорее всего, они отлично парсились чем-нить типа клариона или свободно распространяемого исходника. Счас клариона нет, исходник распространять СБ запрещает. Опять же, менять формат - доставить гимр старым-добрым-надежным клиентам, с которыми три кризиса и десять реорганизаций банка и сто "закрытий" клиента пережили.
← →
Anatoly Podgoretsky © (2010-02-11 23:48) [32]
> vuk © (11.02.10 17:41) [27]
Да какая проблема, как распарсивал, так и расспарсивай, только игнорируй каждую вторую колонку
Хуже если строки разные по количеству колонок. Ведь и такое может быть, даже напрашивается при подобном формате.
А сделан этот формат видимо для печати в текстовом ДОС режиме.
← →
Petr V. Abramov © (2010-02-11 23:58) [33]
> Anatoly Podgoretsky © (11.02.10 23:48) [32]
> А сделан этот формат видимо для печати в текстовом ДОС режиме.
и для этого тоже
← →
vuk © (2010-02-12 00:49) [34]to Anatoly Podgoretsky © (11.02.10 23:48) [32]:
Да не, у меня нет проблем распарсить. В конце концов это всё скриптами делается, одним больше, одним меньше - пофигу. С таблицами справляются на раз. Просто меня наповал убил сам подход - записать в csv элементы визуального оформления таблиц. К печати это отношения не имеет вообще никакого. Это просто очень тупо выполненная задача "записать файл, где данные разделены запятой".
← →
Германн © (2010-02-12 01:00) [35]
> Это просто очень тупо выполненная задача "записать файл,
> где данные разделены запятой".
Угу. Похоже раньше в этом файле было |1|2|3|4
← →
Petr V. Abramov © (2010-02-12 01:03) [36]
> vuk © (12.02.10 00:49) [34]
> К печати это отношения не имеет вообще никакого.
имеет, вернее, имело
> Это просто очень тупо выполненная задача "записать файл,
> где данные разделены запятой".
ну да,
- "теперь у нас формат должен быть в csv!"
- "есть в csv! сроки исполнеы, бюджет исполнен, а причепись, а вот ТЗ"
:)
бывает....
← →
Petr V. Abramov © (2010-02-12 01:08) [37]
> vuk © (12.02.10 00:49) [34]
странно... вроде на байдарках ходишь, под дождь поди попадаешь, а на такую фигню ругаешься.... Или на дождь тоже материшься? :)
← →
vuk © (2010-02-12 01:09) [38]to Германн © (12.02.10 01:00) [35]:
> Угу. Похоже раньше в этом файле было |1|2|3|4
Точно так. Мало того, там такой файлик рядом лежал. :) Просто когда данные были в виде текстовой таблицы, там ячейки могли быть многострочными и я сдуру надеялся, что в csv такого не будет. Надеялся зря. :)
to Petr V. Abramov © (12.02.10 01:03) [36]:
> имеет, вернее, имело
До того, как из этого сделали csv - да имело. Потом - уже нет. :)
← →
vuk © (2010-02-12 01:11) [39]to Petr V. Abramov © (12.02.10 01:08) [37]:
> а на такую фигню ругаешься....
Да не, я не ругаюсь. Я так, в качестве примера, какие талантища водятся на просторах банковских.
> Или на дождь тоже материшься? :)
Знаешь, дождь, он явление природы, материть его бесполезно. Болванов, по-правде говоря, по большей части, тоже.
← →
Германн © (2010-02-12 01:18) [40]
> vuk © (12.02.10 01:09) [38]
> Просто когда данные были в виде текстовой таблицы, там ячейки
> могли быть многострочными и я сдуру надеялся, что в csv
> такого не будет. Надеялся зря. :)
Это как это?
← →
vuk © (2010-02-12 01:26) [41]to Германн © (12.02.10 01:18) [40]
> Это как это?
У полей ширина - фиксированная. Если данные не влезают на одну строку, они пишутся в несколько. Не знаю, получится ли это здесь отобразить, но попробую:| Поле 1 | Поле 2 |Поле 3|
+----------+------------------+------+
| xxxxxxxx | тут всякая фигня | xxxxx|
+----------+------------------+------+
| xxxxxxxx | тут тоже фигня, | xxxxx|
| | но в одну строку | |
| | не уместилась | |
+----------+------------------+------+
← →
vuk © (2010-02-12 01:28) [42]Нда. Не очень получилось, но если скопировать и вставить в блокнот с моноширинным шрифтом, то будет понятно.
← →
Германн © (2010-02-12 01:28) [43]"Раз уж пошла такая пьянка" с файлами csv, то рискну попросить милостыню. :)
Не сможет ли кто, кто умеет, если у него найдется свободная минутка? Нужно вытянуть в файл csv или в любой другой стандартный файл таблицу из таких страниц:
http://www.tutu.ru/rasp.php?st1=80410&st2=79610
http://www.tutu.ru/rasp.php?st1=80410&st2=79610&list=1
http://www.tutu.ru/rasp.php?st1=79610&st2=80410&list=1
← →
Германн © (2010-02-12 01:34) [44]
> vuk © (12.02.10 01:26) [41]
> Не знаю, получится ли это здесь отобразить, но попробую:
>
>
> Нда. Не очень получилось, но если скопировать и вставить
> в блокнот с моноширинным шрифтом, то будет понятно.
>
У меня вроде получилось. И в блокноте то же самое. Явно видна таблица с многострочными ячейками.
Но я про другое спрашивал. Что ты имел в виду, когда говорил "я сдуру надеялся, что в csv такого не будет"?
← →
vuk © (2010-02-12 01:39) [45]to Германн © (12.02.10 01:34) [44]
> Что ты имел в виду, когда говорил "я сдуру надеялся, что
> в csv такого не будет"?
Надеялся получить по стандарту:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",xxxxx
← →
vuk © (2010-02-12 01:45) [46]to Германн © (12.02.10 01:28) [43]:
> "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> милостыню. :)
Тут это... Надо парсер HTML писать. Со всеми вытекающими.
← →
Германн © (2010-02-12 01:54) [47]
> vuk © (12.02.10 01:45) [46]
>
> to Германн © (12.02.10 01:28) [43]:
>
> > "Раз уж пошла такая пьянка" с файлами csv, то рискну попросить
> > милостыню. :)
>
> Тут это... Надо парсер HTML писать. Со всеми вытекающими.
>
>
Тогда может быть попрошу милостыню в отдельном вопросе. Но раз это не "минутная работа", то скорее не стану просить.
← →
Игорь Шевченко © (2010-02-12 01:57) [48]Excel - рулез
← →
Германн © (2010-02-12 01:58) [49]
> vuk © (12.02.10 01:39) [45]
>
> to Германн © (12.02.10 01:34) [44]
>
> > Что ты имел в виду, когда говорил "я сдуру надеялся, что
> > в csv такого не будет"?
>
>
> Надеялся получить по стандарту:
> Поле 1,Поле 2,Поле 3
> xxxxxxxx,тут всякая фигня,xxxxx
> xxxxxxxx,"тут тоже фигня, но в одну строку не уместилась",
> xxxxx
>
А есть такой стандарт?
Я считал что стандарт в данном случае будет:
Поле 1,Поле 2,Поле 3
xxxxxxxx,тут всякая фигня,xxxxx
,"тут тоже фигня,,
,но в одну строку,,
,не уместилась",,
← →
Германн © (2010-02-12 02:01) [50]
> Игорь Шевченко © (12.02.10 01:57) [48]
>
> Excel - рулез
>
Во-во. Именно им и пользуюсь. Но сначала долго и упорно работаю топором. :)
Не все же столько знают и умеют. :)
← →
Petr V. Abramov © (2010-02-12 02:04) [51]
> vuk © (12.02.10 01:26) [41]
>
> У полей ширина - фиксированная. Если данные не влезают на
> одну строку, они пишутся в несколько. Не знаю, получится
> ли это здесь отобразить, но попробую:
>
> | Поле 1 | Поле 2 |Поле 3|
> +----------+------------------+------+
> | xxxxxxxx | тут всякая фигня | xxxxx|
> +----------+------------------+------+
> | xxxxxxxx | тут тоже фигня, | xxxxx|
> | | но в одну строку | |
> | | не уместилась | |
> +----------+------------------+------+
< при цитировании съехало> но я понял идею.
ууу дык тут просто ТА технология парсинга, а не ЭТА :)
я, чесснро, говоря, был админом (не разработчиком) ПРИ ЭТОМ, но помню, что народ понимал друг друга с полуслова.
P.S. (полушутка) найми программиста, в требованиях укажи "от 65+ лет, опыт в банке", не на полную ставку, сдельно, на чудацкие форматы. Нормальных, как всегда, не найдешь быстро, но в конце концов проблему решишь.
← →
vuk © (2010-02-12 02:04) [52]to Германн © (12.02.10 01:58) [49]:
> А есть такой стандарт?
http://ru.wikipedia.org/wiki/CSV
← →
vuk © (2010-02-12 02:06) [53]to Petr V. Abramov © (12.02.10 02:04) [51]:
> найми программиста
Я пока справляюсь. :P
← →
Германн © (2010-02-12 02:10) [54]
> vuk © (12.02.10 02:04) [52]
1996,Jeep,Grand Cherokee,"MUST SELL!
air, moon roof, loaded",4799.00
Да такого не встречал. Век живи...
Буду знать, если что.
← →
Германн © (2010-02-12 02:15) [55]
> Германн © (12.02.10 02:10) [54]
>
>
Вдогонку. Наверно ту "нестандартную" ерунду писал кто-то вроде меня. Т.е. не специалист, но что-то, где-то знает. Но которого "имеют" как специалиста. :)
← →
Игорь Шевченко © (2010-02-12 02:21) [56]
> http://ru.wikipedia.org/wiki/CSV
Уродский формат
← →
vuk © (2010-02-12 02:25) [57]to Игорь Шевченко © (12.02.10 02:21) [56]:
> Уродский формат
Ну, не без этого. Но это лучше, чем красиво оформленные таблицы в тексте. Я ж говорю, продвинутые применяют формат 1С. Особо продвинутые знают об XML. Но круг узок. Чаще приходится иметь дело как раз с таблицами.
← →
Германн © (2010-02-12 02:27) [58]Хм.
← →
Германн © (2010-02-12 02:28) [59]
> Германн © (12.02.10 02:27) [58]
Мой пост был написан до vuk © (12.02.10 02:25) [57]
← →
Petr V. Abramov © (2010-02-12 02:30) [60]
> vuk © (12.02.10 02:06) [53]
>
> to Petr V. Abramov © (12.02.10 02:04) [51]:
>
> > найми программиста
>
> Я пока справляюсь. :P
дык я тоже коромысло донесу и безвыходное положение заставит еще че зделаю. Но у специально обученнго человека лучше выйдет и дешевле.
:)
← →
Германн © (2010-02-12 02:34) [61]
> Petr V. Abramov © (12.02.10 02:30) [60]
Ищешь работу? :)
← →
Игорь Шевченко © (2010-02-12 02:58) [62]vuk © (12.02.10 02:25) [57]
"В сущности, CSV представляет собой азбучный пример того, как не следует проектировать текстовый формат. Проблемы, связанные с ним, начинаются с ситуации, когда разделяющий символ (в данном случае, запятая), находится внутри поля. В Unix в таком случае для буквального представления разделителя перед ним был бы вставлен символ обратной косой черты, а буквальная обратная косая черта представлялась бы при помощи двойной обратной косой черты. Такая конструкция создает единственный частный случай (знак переключения), который необходимо проверять во время синтаксического анализа файла, и требует единственного действия, когда такой символ найден, а именно - интерпретировать следующий символ буквально. Данное действие не только обрабатывает разделяющий символ, но и предствляет способ обработки знака переключения и символов новой строки без дополнительных ухищрений. С другой стороны, в формате CSV целое поле заключается в двойные кавычки, в случае, если оно содержит символ-разделитель. Если поле содержит двойные кавычки, его также необходимо заключать в двойные кавычки, а отдельные двойные кавычки в поле необходимо повторять дважды, для того, чтобы указать, что они не завершают поле.
Существует два негативных результата роста числа частных случаев. Во-первых, возрастает сложность синтаксического анализатора (и его чувствительность к ошибкам). Во-вторых, ввиду того, что правила формата сложны и непредусмотрены, различные реализации расходятся в обработке граничных случаев. Иногда продолжающиеся строки поддерживаются путем начала последнего поля строки с незакрытых двойных кавычек, но только в некоторых продуктах."
← →
Petr V. Abramov © (2010-02-12 03:17) [63]
> Игорь Шевченко © (12.02.10 02:58) [62]
ну в общем случае любой формат - ацтой.
а когда в файле - числа и строки, причем строки - не цитаты из войны и мира, а названия электроплит, - формат ПРЕКРАСНЫЙ.
← →
Petr V. Abramov © (2010-02-12 05:41) [64]
> Германн © (12.02.10 02:34) [61]
на твоей народ жажда одолевает?
:)
← →
KSergey © (2010-02-12 09:00) [65]> Германн © (12.02.10 01:28) [43]
Нужно "круто и гибко" или "чтобы работало"?
Ну я на что намякиваю: сделать под конкретный случай.. ну не парсер, а пережевывалку - легко.
Но вот "чтобы всегда работало и легко перестраивалось под новые форматы" (исли страницу переверстают) - сложно, понятно.
Как надо?
← →
Anatoly Podgoretsky © (2010-02-12 09:08) [66]> vuk (12.02.2010 00:49:34) [34]
Ну тупые.
← →
Германн © (2010-02-12 12:02) [67]
> KSergey © (12.02.10 09:00) [65]
>
> > Германн © (12.02.10 01:28) [43]
>
> Нужно "круто и гибко" или "чтобы работало"?
> Ну я на что намякиваю: сделать под конкретный случай.. ну
> не парсер, а пережевывалку - легко.
> Но вот "чтобы всегда работало и легко перестраивалось под
> новые форматы" (исли страницу переверстают) - сложно, понятно.
>
>
> Как надо?
>
"Под конкретный случай".
← →
12 © (2010-02-12 13:42) [68]
> Германн © (12.02.10 01:28) [43]
s:=IdHTTP1.Get("http://www.tutu.ru/rasp.php?st1=80410&st2=79610");
и pos в руки ..
"лучше 5 дней потерять" (c)
Там не меняется походу уже года 2
Страницы: 1 2 вся ветка
Форум: "Прочее";
Текущий архив: 2010.08.27;
Скачать: [xml.tar.bz2];
Память: 0.64 MB
Время: 0.058 c