Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Форум: "Потрепаться";
Текущий архив: 2002.03.11;
Скачать: [xml.tar.bz2];

Вниз

RE   Найти похожие ветки 

 
handra   (2002-01-24 13:41) [0]

...возвращаясь к прошлому...
Помнится, в форумах обсуждалься вопрос по поводу определения кодировки русского текста (win, dos, koi) и функций преобразование для него. Были предложены частотные, исключающие способы...
Увы, поиск по сайту с целью локализации той дискуссии результатов не дал.
Всем, у кого осталось/имеется что-либо на эту тему - просьба, откликнитесь. Приветствуется готовая библиотека функций, т.к. вермени на ее создание, ко сожалению, уже нет.
Заранее благодарен, Ваш handra.


 
Виктор Щербаков   (2002-01-24 14:12) [1]

Function TForm1.DetectCharSet(FName : String) : Integer; // by Sergey Luzan ----
// -1: Charset not detected
// 1: DOS
// 2: WIN
CONST
MaxSize = 4096; // Max text length analized for detecting charset
DOSTopChars : String = #165#168#173#174;
// "еино" в кодировке DOS - часто встречающиеся символы
WINTopChars : String = #229#232#237#238;
// "еино" в кодировке WIN - часто встречающиеся символы
Type
TMyBuffer = Array[1..MaxSize] OF Char;
Var
DOSCount, WINCount : Integer;
TopDOSChar, TopWINChar : Array[Char] OF Boolean;
F: file;
Size: Cardinal;
Buffer: ^TMyBuffer;
i : Integer;
c : Char;
Begin
DOSCount:=0; WINCount:=0;
FOR c:=#0 TO #255 DO
Begin
TopDOSChar[c] := ( Pos(c,DOSTopChars) > 0 );
TopWINChar[c] := ( Pos(c,WINTopChars) > 0 );
End;
{$I-}
AssignFile(F, FName);
Reset(F,1);
{$I+}
IF IOResult=0 Then // File found
Begin
Size := FileSize(F);
IF Size>MaxSize Then Size:=MaxSize;
try
GetMem(Buffer, Size);
try
BlockRead(F, Buffer^, Size);
FOR i:=1 TO Size DO
Begin
IF TopDOSChar[Buffer^[i]] Then Inc(DOSCount);
IF TopWINChar[Buffer^[i]] Then Inc(WINCount);
End;
finally
FreeMem(Buffer);
end;
finally
CloseFile(F);
end;
End; { IOResult = 0 }
IF DOSCount=WINCount Then
DetectCharSet:=-1
Else
IF DOSCount>WINCount Then DetectCharSet:=1
Else DetectCharSet:=2;
End; { DetectCharSet }


 
handra   (2002-01-25 15:30) [2]

to Виктор Щербаков > спасибо, немного легче...
to all> видать забыли?! или сюда заходят, чтобы испачкать друг друга д..., грязью?



Страницы: 1 вся ветка

Форум: "Потрепаться";
Текущий архив: 2002.03.11;
Скачать: [xml.tar.bz2];

Наверх





Память: 0.44 MB
Время: 0.004 c
14-32551
MJH
2002-01-26 11:31
2002.03.11
MSVCR70.DLL


6-32526
Olfi
2001-12-23 19:15
2002.03.11
Нужен help по компоненту NMSMTP1


3-32396
HDD
2002-02-11 15:11
2002.03.11
Help DEAR PEOPLE


3-32388
СиндяшкинДВ
2002-02-12 10:57
2002.03.11
Проблема с групповой полосой в отчете


1-32511
Yakudza
2002-02-25 17:15
2002.03.11
Uses





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский