Форум: "Потрепаться";
Текущий архив: 2004.10.10;
Скачать: [xml.tar.bz2];
ВнизЧто такое контрольная сумма файлов??? Найти похожие ветки
← →
Sirus (2004-09-09 07:43) [0]Привет Мастера...
Есть вопросы:
1. Что такое контрольная сумма файлов?
2. Уникальна ли эта сумма?
3. Как ее вычислить? (алгоритм)
← →
Рамиль © (2004-09-09 08:10) [1]Например
http://www.yandex.ru/yandsearch?text=CRC+%E0%EB%E3%EE%F0%E8%F2%EC&stype=www&rpt=rad
← →
Sirus (2004-09-10 14:06) [2]Для начала мне нужно знать что это такое...
потом узнать, уникальна ли контрольная сумма файлов...
А уж потом сами алгоритмы...
← →
Rem (2004-09-10 14:14) [3]Не уникальна.
Нужна уникальность - используйте алгоритмы хеширования.
← →
VMcL © (2004-09-10 14:23) [4]>>Rem (10.09.04 14:14) [3]
А хеш с какого бадуна вдруг станет уникальным?
← →
Cosinus © (2004-09-10 14:33) [5]>> Rem
Найди у себя на компе хотя бы 2 файла с одинаковым CRC32...
Это я к тому, что уникальности то в прямом смысле не будет, но вероятность совпадения мала. Насколько мала - это наверно на алголист надо, я не смогу оценить.
ЗЫ А хештрование не дает уникальности, совершенно прав VMcL, просто подобрав хорошую функцию, можно достичь о-о-о-очень маленькой вероятности повторения.
← →
Rem (2004-09-10 14:50) [6]2 [4]
SHA-1
← →
SergP. (2004-09-10 14:57) [7]
> Для начала мне нужно знать что это такое...
Что-то типа некоторого числа небольшой разрядности значение которого зависит от каждого байта файла, с помощью которого обычно контролируется целостность данных файла.
← →
VMcL © (2004-09-10 14:59) [8]>>Rem (10.09.04 14:50) [6]
Длина любого конкретного хеша фиксирована, а размер данных - нет. Дальше объяснять нужно или выводы сам сделаешь?
← →
Rem (2004-09-10 15:16) [9]"Hash-функция SHA-1 (дайджест) для байтового массива или строки символов.
Этот алгоритм (Secure Hash Standard-1) разработан NIST (National Institute of Standards and Technology) и опубликован в FIPS180-1 (Federal Information Processing Standards Publication 180-1). Функции SHA-1 генерируют 160-битный массив, состоящий из пяти двойных слов (или 20 байт). По дайджесту практически невозможно восстановить исходное сообщение. Невозможно также найти другое сообщение с тем же дайджестом."
Насколько я понял автора вопроса, ему необходимо проверять истинность данных. SHA-1 ему в этом поможет.
← →
VMcL © (2004-09-10 15:22) [10]>>Rem (10.09.04 15:16) [9]
Перечитай пост [8]. "Можно два раза" © Игорь Шевченко.
>Невозможно также найти другое сообщение с тем же дайджестом.
Возможно. Вопрос только в том, сколько это займет времени.
← →
вразлет © (2004-09-10 16:52) [11]Если она уникальна, то это уже сжатие без потерь, а не контрольная сумма)
← →
Cosinus © (2004-09-10 16:53) [12]
> вразлет © (10.09.04 16:52) [11]
Угу :)))
← →
П7 (2004-09-21 11:42) [13]
> Cosinus © (10.09.04 16:53) [12]
Не угу... md5 тоже уникальный результат выдаёт, только алгоритма обратного нет... (:
← →
SergP. (2004-09-21 11:57) [14]
> Не угу... md5 тоже уникальный результат выдаёт, только алгоритма
> обратного нет... (:
С чего это ты взял что md5 выдает уникальный результат???
← →
вразлет © (2004-09-21 12:06) [15]Гы
← →
П7 (2004-09-21 12:07) [16]
> SergP. (21.09.04 11:57) [14]
С того, что его используют для "псевдо-шифрования" паролей в программах, где хоть немного важна безопасность информации пользователя. А поскольку сам алгоритм открыт, то не имелобы смысла шифровать его. Время подбора пароля сократилось бы в зависимости от того, сколько есть разных символьных массивов, которые при md5-шифровании дадут один и тот же результат!!!
Вот с этого то я и "взял"... (:
← →
VMcL © (2004-09-21 12:11) [17]>>П7 (21.09.04 11:42) [13]
>>П7 (21.09.04 12:07) [16]
>md5 тоже уникальный результат выдаёт
Это с какого бадуна? Посмотри в словаре значение слова "уникальный".
← →
Dok_3D © (2004-09-21 12:12) [18]2 VMcL
2 Cosinus
>>Найди у себя на компе хотя бы 2 файла с одинаковым CRC32...
Найду. Вероятность довольно высока. И ты, возможно, у себя найдешь, если файлов несколько десятков тысяч.
>>ЗЫ А хештрование не дает уникальности, совершенно прав VMcL
Строго говоря - да, не дает. Но, я не понял, что за аргумент такой: Длина любого конкретного хеша фиксирована, а размер данных - нет
Это как раз неважно. Если длина хэша - 160 бит, то очень просто увидеть, сколько вариантов можно заложить в последовательность такой длины.
Правильно - 2 в степени 160. Большое число. Поэтому, его можно использовать для определения уникальности. И используют вовсю.
← →
VMcL © (2004-09-21 12:46) [19]>>Dok_3D © (21.09.04 12:12) [18]
>Но, я не понял, что за аргумент такой: Длина любого конкретного хеша фиксирована, а размер данных - нет
Если бы размер данных был меньше размера данных, то теоретически можно было бы создать такой алгоритм хеша, который бы выдавал именно уникальное значение для любых входных данных, ограниченных лишь вышеприведенным условием. Только в этом не было бы никакого смысла, поскольку зачем нужен хеш большего размера, чем данные? Разве что для аутентификации.
Но поскольку длина хеша фиксирована (например, для MD5 это 128 бит), а длина данных нет, то хеш, вычисленный для любых данных, может совпасть с хешем, вычисленным для других данных, но, к счастью, с очень малой вероятностью. К тому же, часто, кроме хеша для контроля используют еще и размер исходных данных, что, если не ошибаюсь, значительно снижает вероятность совпадения хеша.
← →
Dok_3D © (2004-09-21 12:55) [20]2VMcL
Угу, смысл аргумента понял :)
Страницы: 1 вся ветка
Форум: "Потрепаться";
Текущий архив: 2004.10.10;
Скачать: [xml.tar.bz2];
Память: 0.49 MB
Время: 0.034 c