Форум: "Прочее";
Текущий архив: 2014.10.19;
Скачать: [xml.tar.bz2];
ВнизПомогите с правилами XML Найти похожие ветки
← →
Друг (2014-03-06 18:09) [0]Как я уже говорил, пишу библиотеку для конвертации текстов. Одной из поддерживаемых особенностей - это возможность кодировать/декодировать XML и HTML строки. Т.е. однозначно идентифицировать символы &...; и при необходимости приводить символы к этому виду.
Я штудирую эти ссылки
Но не хватает грамотной точной краткой информации
http://citforum.ru/internet/xmlspec/xmlspec.shtml
http://www.w3.org/TR/2008/REC-xml-20081126/
Ставим задачу. Допустим необходимо закодировать исходную строку в строку с символами &...; Причём результирующая строка должна быть например в кодировке Windows-1251. Сформулируйте правила, опираясь на которые, большинство символов я оставлю без изменений, а какие-то приведу к виду &...;
Спасибо.
← →
Rouse_ © (2014-03-06 20:42) [1]
> Сформулируйте правила, опираясь на которые, большинство
> символов я оставлю без изменений, а какие-то приведу к виду
> &...;
С нормализацией ты можещь все закодировать через амперсанд.
А вообще не понял глубины спича - там по твоей же ссылке все описано...
← →
DVM © (2014-03-06 22:26) [2]Немного не в тему, только сегодня наткнулся на внушительный список вариантов кодирования Unicode символов в Ansi строках. Сколько же наизобретали велосипедов. http://billposer.org/Software/ListOfRepresentations.html
← →
Друг (2014-03-07 00:02) [3]> DVM © (06.03.14 22:26) [2]
> Немного не в тему, только сегодня наткнулся на внушительный
> список вариантов кодирования Unicode символов в Ansi строках.
> Сколько же наизобретали велосипедов. http://billposer.org/Software/ListOfRepresentations.html
Всё это от лукавого :)
В HTML/XML/XHTML только é и é :)
← →
Друг (2014-03-07 00:04) [4]не знал, что на дельфимастер &..; заменяется на символ :)
← →
Друг (2014-03-07 00:06) [5]> С нормализацией ты можещь все закодировать через амперсанд.
> А вообще не понял глубины спича - там по твоей же ссылке
> все описано...
Okey.
Попробуй сформулировать ответ :)
Мне с учётом скудных знаний XML и его особенностей - не удаётся
← →
Друг (2014-03-08 14:33) [6]Кому интересно
http://www.weblancer.net/projects/583666.html
← →
DevilDevil © (2014-03-09 13:59) [7]Не верится, что на нашем форуме нет XML-специалистов :)
← →
turbouser © (2014-03-09 15:11) [8]
> DevilDevil © (09.03.14 13:59) [7]
xml избыточен, не любим мы его :) но деваться некуда, мелкософт и все такое..
спецов по xml лучше бы где-нить в индии поискал
← →
ухты (2014-03-09 15:31) [9]а чего в нем разбираться?
← →
DevilDevil © (2014-03-09 15:58) [10]> ухты (09.03.14 15:31) [9]
ответь на поставленный в [0] вопрос
← →
Inovet © (2014-03-09 16:08) [11]> [7] DevilDevil © (09.03.14 13:59)
> XML-специалистов
Глаза б мои его не видели. Берём да делаем, а куда деваться. Вот сейчас как раз схемы привёл в порядок, получилось 120 кБ в 17 файлах, и ещё там добавится. Это минимум - то, что сейчас надо, а так ещё умножить 10. Чё там получилось после XML Data Binding? Получилось по 0,5 МБайт сгенерённого исходника. Хорошо, что не руками приходится эту муть выписывать. Ну, можно теперь и с данными поработать, XML - это только для обмена.
А ещё и оптимизацией его заниматься?.. Нет уж, я удовольствие получаю от более интересных занятий, которые, кстати отложены из-за вот этого совокупления.
← →
DevilDevil © (2014-03-09 16:13) [12]> Inovet © (09.03.14 16:08) [11]
> Глаза б мои его не видели.
Я не знаю где твои глаза - но явно не здесь :)
Тебя никто не заставляет любить, или уж тем более оптимизировать XML :)
По крайней мере в рамках данной ветки :)
← →
Inovet © (2014-03-09 16:22) [13]> [12] DevilDevil © (09.03.14 16:13)
Да XML и не виноват, формат да и формат, ничего против него не имею. Но с ним связано много идиотизма, так что уже определённый рефлекс выработался.
← →
DevilDevil © (2014-03-09 17:20) [14]> Inovet © (09.03.14 16:22) [13]
Лучше бы у тебя выработался рефлекс отвечать на вопросы :)
← →
Дмитрий СС (2014-03-09 17:34) [15]Не знаю как в XML, но в HTML с помощью & можно кодировать символы не из выбранной кодировки.
← →
Дмитрий СС (2014-03-09 17:36) [16]Например, кодировка сайта Windows-1251, а писать можно так:
例えば。
← →
Inovet © (2014-03-09 17:36) [17]> [14] DevilDevil © (09.03.14 17:20)
Я сам определюсь, что для меня лучше. А ты за собой последи, поработай над своим психическим состоянием, мировоззрение приведи в соответсвие со своими же собственными требованиями, общение с людьми наладь. А на на оптимизации забей, в жизни много чего есть куда более интересного. Ок?
← →
DevilDevil © (2014-03-09 17:43) [18]> Дмитрий СС (09.03.14 17:34) [15]
> Не знаю как в XML, но в HTML с помощью & можно кодировать
> символы не из выбранной кодировки.
Можно конечно
В HTML целый парад символов, которые можно кодировать иначе:
http://ru.wikipedia.org/wiki/Мнемоники_в_HTML
> Inovet © (09.03.14 17:36) [17]
Okey ))))))))))
← →
ухты (2014-03-09 18:31) [19]
> ответь на поставленный в [0] вопрос
там неначто отвечать, когда делать нечего можно и не то придумать...
← →
имя (2014-03-09 18:42) [20]Удалено модератором
← →
ухты (2014-03-09 19:10) [21]ну я бы понял если бы это написал чел которого тут не банили.. ну а вы то куда, месяца не проходит? :)
вот тут бесплатно есть - http://coderstoolbox.net/string/#!encoding=xml&action=encode&charset=us_ascii
почитайте про сдата, енкодинг и т.д.
← →
имя (2014-03-09 19:37) [22]Удалено модератором
← →
ухты (2014-03-09 20:33) [23]Удалено модератором
← →
DevilDevil © (2014-03-09 20:36) [24]Удалено модератором
← →
ухты (2014-03-09 21:03) [25]Удалено модератором
← →
Юрий Зотов © (2014-03-09 21:09) [26]http://www.hardforum.ru/t53359/
Может, это?
← →
DevilDevil © (2014-03-09 21:29) [27]> Юрий Зотов © (09.03.14 21:09) [26]
к сожалению нет
и там приведены не XML, а HTML, причём весьма скромный список
ссылка на полный в посте [18]
← →
ухты (2014-03-09 21:47) [28]http://en.wikipedia.org/wiki/List_of_XML_and_HTML_character_entity_references#Predefined_entities_in_XML
тут еще есть, а еще тут www.xml.com
← →
DevilDevil © (2014-03-09 22:02) [29]> ухты (09.03.14 21:47) [28]
вот эти круче:
http://citforum.ru/internet/xmlspec/xmlspec.shtml
http://www.w3.org/TR/2008/REC-xml-20081126
особенно:
http://www.jelks.nu/XML/xmlebnf.html
← →
ухты (2014-03-09 23:37) [30]это все одно и тоже а в последней особенность прям там и сказана, типа "без словоблудия", и только, вы сами то их читали? а то есть подозрения...
← →
DevilDevil © (2014-03-09 23:54) [31]> ухты (09.03.14 23:37) [30]
дак а ты прочитал?
особенно ту, что без словоблудия :)
← →
ухты (2014-03-09 23:58) [32]нет конечно, мне оно зачем? :)
← →
DevilDevil © (2014-03-10 00:17) [33]> ухты (09.03.14 23:58) [32]
> нет конечно, мне оно зачем? :)
Чтобы ответить на поставленный вопрос
Ведь для этого создают ветки, а не для того, чтобы каждый желающий мог отправлять бесполезные или полубесполезные ссылки :)
Мне нужна помощь специалиста по XML, я об этом заявил в первом же посте. И я готов за эту помощь заплатить
← →
turbouser © (2014-03-10 02:19) [34]
> DevilDevil ©
Ты знаешь, в заголовке указывается кодировка. Для спец символов придумано &
То, что в 0 - на вопрос никак не тянет.
← →
DevilDevil © (2014-03-10 12:15) [35]> turbouser © (10.03.14 02:19) [34]
> То, что в 0 - на вопрос никак не тянет.
Ну дак ты сходи по ссылкам, посмотри, прикинь. А потом будешь говорить, что тянет на вопрос, а что нет. )))
← →
sniknik © (2014-03-11 08:24) [36]вообще чего "париться"? создаем DOM объект с одним тегом присваиваем ему значение, строку со всеми символами "as is" (или 256 пронумерованных тегов с 1 символом) сохраняем в файл, смотрим что он сконвертил...
не получится?
← →
antonn © (2014-03-11 09:57) [37]
> Друг (07.03.14 00:04) [4]
>
> не знал, что на дельфимастер &..; заменяется на символ :
> )
разве не браузер заменяет?
← →
DevilDevil © (2014-03-11 10:53) [38]> sniknik © (11.03.14 08:24) [36]
таким образом ты отследишь только <>""&
для каждой entity там свои особенности: http://www.jelks.nu/XML/xmlebnf.html
← →
Kerk © (2014-03-11 11:53) [39]Почему для начала не посмотреть как оно сделано в ________ (вставить название любимого опенсорсного движка для XML)?
← →
DevilDevil © (2014-03-11 12:14) [40]> Kerk © (11.03.14 11:53) [39]
это план C
к слову я смотрел несколько исходников парсеров XML
поскольку я привык работать с профи и доверять профи, на данный момент следую планам А/Б и прорабатываю другие моменты
Страницы: 1 2 3 4 вся ветка
Форум: "Прочее";
Текущий архив: 2014.10.19;
Скачать: [xml.tar.bz2];
Память: 0.54 MB
Время: 0.004 c