Главная страница
    Top.Mail.Ru    Яндекс.Метрика
Текущий архив: 2010.02.28;
Скачать: CL | DM;

Вниз

Методы хранения сильно разреженных матриц   Найти похожие ветки 

 
Xandr001   (2008-09-08 09:19) [0]

В общем такая ситуация. Есть массив

var
Kad_number: Array[1..99, 0..99, 0..99, 1..99, 1..9999] of Integer;


Он очень разрежен (ок 200 000 записей), но сохранить размерность необходимо. Загружается динамически при открытии файла - справочника. Всё это жрёт больше 2х гигов памяти. Не компилирутся даже...
вот вопрос: есть ли какие-то способы хранения этого добра не выделяя память под весь массив, а только под заполненные ячейки?
Нашёл в сети 1 способ, там создаются отдельные массивы/строки для каждого из измерений массива, в которых записываются индексы ненулевых элементов, и 1 массив/строка в кот. хранятся сами значения ненулевых элементов.
Этот способ мне не подходит, потому что мне необходим прямой доступ к каждому элементу. То есть при поступлении на вход строки типа: "05:01 03 45:0567" мне нужно сразу узнать значение элемента Kad_number[5,1,3,45,567].


 
MBo ©   (2008-09-08 09:32) [1]

Если приведенный способ или его вариации не нравятся, используй другую структуру данных, а не массив, например - хэш-таблицу.


 
brother ©   (2008-09-08 09:33) [2]

может к БД присмотришься?


 
palva ©   (2008-09-08 09:33) [3]

Если нужен только доступ, то обычно используют базу данных с индексами.


 
Vlad Oshin ©   (2008-09-08 09:38) [4]

как-то файлы использовал. число и индекс. соотв. остальное =0.


 
Xandr001   (2008-09-08 09:42) [5]


> Если приведенный способ или его вариации не нравятся, используй
> другую структуру данных, а не массив, например - хэш-таблицу.
>

Вы вообще можете вообразить себе какого размера получится хеш-таблица??? Мне кажется что много я не выиграю.


> может к БД присмотришься?


 
Сергей М. ©   (2008-09-08 09:46) [6]


> Xandr001   (08.09.08 09:42) [5]


СУБД как раз и предназначина в т.ч. для такого рода задач


 
Xandr001   (2008-09-08 09:47) [7]


> может к БД присмотришься?



> Если нужен только доступ, то обычно используют базу данных
> с индексами.


Думал об этом. Но я ни разу не сталкивался с БД. Даже не в курсах что там к чему. Вот скажите мне: если будет таблица из 6 полей. долго ли будет выполняться sql запрос на поиск строки по 5 ограничивающим полям? Или как там правильно говорить... кароче условие проверяющее на соответствие 5 полей.


 
Xandr001   (2008-09-08 09:56) [8]

Или есть возможность делать n-мерные таблицы???


 
Медвежонок Пятачок ©   (2008-09-08 09:57) [9]

быстро. не успеешь зевнуть.


 
Сергей М. ©   (2008-09-08 09:59) [10]


> долго ли будет выполняться sql запрос


Это зависит от многих факторов.
Но у тебя вряд ли есть выбор)


 
Xandr001   (2008-09-08 10:04) [11]


> Но у тебя вряд ли есть выбор)

:)

Дело в том, что из этой бд нужно заполнять выходную табличку, в которой около 70 тысяч записей. и это нужно выполнять для разного набора выходных таблиц. ограничение по времени - максимум 2 минуты на 1 выходную таблицу...


 
MBo ©   (2008-09-08 10:11) [12]

>Вы вообще можете вообразить себе какого размера получится хеш-таблица???

Примерно в полтора-два раза больше, чем данных фактически имеется ;)
Однако с БД проще.


 
Сергей М. ©   (2008-09-08 10:12) [13]

И что ?


 
Xandr001   (2008-09-08 10:34) [14]


> И что ?

Это видимо мне... Извините. Просто не договорил.
Вот что: для каждой строки выходной таблицы нужно найти строку в справочнике, потом 2 операции присвоения, следущая строка. Мне интересно будет ли работа с БД укладываться в эти временные рамки


 
Сергей М. ©   (2008-09-08 10:36) [15]


> будет ли работа с БД укладываться в эти временные рамки


При грамотном подходе - да.


 
Xandr001   (2008-09-08 10:59) [16]


> При грамотном подходе

Ну значит буду искать этот грамотный подход.


 
Anatoly Podgoretsky ©   (2008-09-08 11:58) [17]


> Вы вообще можете вообразить себе какого размера получится
> хеш-таблица???

200 000 * размер хеша - короче немного.

1..99 - 1
0..99 - 1
0..99 - 1
1..99 - 1
1..9999 - 2

Итого шесть байт = 1.2 мб


 
han_malign ©   (2008-09-08 13:47) [18]


> Итого шесть байт

10^12(980001990000) - это пять байт...


 
Anatoly Podgoretsky ©   (2008-09-08 13:56) [19]

> han_malign  (08.09.2008 13:47:18)  [18]

У тебя двоичный хеш, у меня строковый


 
Xandr001   (2008-09-08 14:57) [20]

Товарищи! Есть мнение что мне не так преподавали теорию хеш таблиц...
Можно в двух словах о том, что вы понимаете под хешем и хеш таблицей?


 
int64   (2008-09-08 15:09) [21]

Xandr001   (08.09.08 09:19)  

Непонятно, что ты подразумеваешь под "прямой доступ к каждому элементу".


 
MBo ©   (2008-09-08 15:11) [22]

Хэш таблица - строка "05:01 03 45:0567" или набор индексов 5,1,3,45,567 отображается на число в небольшом диапазоне (например для 200 тыс записей - 0..262143, или побольше, чтобы уменьшить число конфликтов), это число и будет индекс в массиве хэш-таблицы (без учета конфликтов, которых будет немного, полностью их избежать можно с использованием идеального хэширования, что здесь допустимо, поскольку таблица статичная)


 
Anatoly Podgoretsky ©   (2008-09-08 15:15) [23]

> Xandr001  (08.09.2008 14:57:20)  [20]

Хеш элемент хеш таблицы - одна строка


 
int64   (2008-09-08 15:16) [24]

И опять же все зависит от разряженности. Может достаточно будет хранить тем 1 способом, что ты нашел в сети: "координаты: значение"


 
Xandr001   (2008-09-08 15:50) [25]

"05:01 03 45:0567" - входящее значение.


> "прямой доступ к каждому элементу":

i:=Kad_number[5,1,3,45,567];


 
int64   (2008-09-08 16:30) [26]

Xandr001   (08.09.08 15:50) [25]

> > "прямой доступ к каждому элементу":
>
> i:=Kad_number[5,1,3,45,567];


И что я должен понять?
След. код, в твоем понимании, прямой или кривой доступ?

 TDefault = class
 private
   function GetKad_number(Index1, Index2, Index3, Index4, Index5: Integer):
       Integer;
   procedure SetKad_number(Index1, Index2, Index3, Index4, Index5: Integer; const
       Value: Integer);
 public
   property Kad_number[Index1, Index2, Index3, Index4, Index5: Integer]: Integer
       read GetKad_number write SetKad_number;
 end;

implementation

function TDefault.GetKad_number(Index1, Index2, Index3, Index4, Index5:
   Integer): Integer;
begin
 Result := // не "прямой доступ к каждому элементу"
end;

procedure TDefault.SetKad_number(Index1, Index2, Index3, Index4, Index5:
   Integer; const Value: Integer);
begin
 // и здесь не "прямой доступ к каждому элементу"
end;


 
Anatoly Podgoretsky ©   (2008-09-08 16:41) [27]

> int64  (08.09.2008 16:30:26)  [26]

> И что я должен понять?
> След. код, в твоем понимании, прямой или кривой доступ?

Понять ты должен, что это доступ к ассоциативному массива, который никогда не бывает прямым, если только ассоциативные массивы не реализованы в самом языке.


 
int64   (2008-09-08 17:14) [28]

Anatoly Podgoretsky ©   (08.09.08 16:41) [27]
Я знаю, что такое массив и что такое ассоциативный массив. Спасибо.

Я хочу убедиться знает ли автор, что такое прямой доступ.
У меня есть подозрение, что ему нужна лишь синтаксическая конструкция вида: Kad_number[5,1,3,45,567]. Т.к., в противном случае, вопрос стоял бы так:
"У меня есть тип данных, превышающий 2Гб, но я связан по рукам использовать другой тип данных, и использовать другой доступ кроме прямого итд"


 
Xandr001   (2008-09-09 10:20) [29]


> Я хочу убедиться знает ли автор, что такое прямой доступ.

да. я знаю.

> вопрос стоял бы так: ...

у меня скил "искусство задавать правильные вопросы" не прокачан...


 
brother ©   (2008-09-09 10:31) [30]

> у меня скил "искусство задавать правильные вопросы" не прокачан...

у нас скилл телепатора тож)


 
evvcom ©   (2008-09-09 11:58) [31]

В моем понимании "прямой доступ к элементу массива" это, когда я получаю указатель на этот элемент, и за этим элементом лежит следующий, если он имеется. В этом случае я не теряю время на определение координат этого следующего элемента. Всё это имеет смысл, когда массив непрерывный. В случае же "разреженного", может быть даже упакованного по сути массива (ассоциативного) иметь такой прямой доступ не вижу смысла.


 
Xandr001   (2008-09-09 15:37) [32]


> Всё это имеет смысл, когда массив непрерывный

Массив заполняется блоками.


 
evvcom ©   (2008-09-10 15:48) [33]

какими блоками? Блоками по 4 байта? :)
Вот у тебя элемент [5,1,3,45,567]. Какими блоками мы чего заполняем? Давай на пальцах


 
Xandr001   (2008-09-12 06:08) [34]

давай.
1) непрерывный линейный массив arr[0..14]: 1,2,5,9,8,3,5,7,88,6,3,6,8,2,8
2) разреженный линейный массив arr[0..14]: 0,0,5,0,0,0,0,7,0,0,3,0,0,0,8
3) линейный массив arr[0..14] заполняется блоками: 2,5,5,4,7,0,0,0,0,0,3,6,7,9,8

Длинна блоков и пустых элементов между ними не известна заранее, но постоянна после загрузки массива, т.е. в процессе выполнения программы массив статичен.


 
KilkennyCat ©   (2008-09-12 08:47) [35]

а зачем его загружать-то?
массив вещь жесткая, че его не читать с файла-то? позиция нужного элемента моментально определяется при столь фиксированных параметрах.


 
Xandr001   (2008-09-12 11:05) [36]


> столь фиксированных параметрах

Это Вы про какие такие параметры????????????


 
KilkennyCat ©   (2008-09-12 11:20) [37]

про размер данных.


 
Jeer ©   (2008-09-12 11:55) [38]

Покурите:
http://www.robosoft.info/knowledge/articles/detail.php?ID=886


 
Xandr001   (2008-09-12 14:14) [39]


> про размер данных

Всё так, но только в идеальных условиях. дело в том, что входная строка может иметь различные виды:
"05:01 03 45:0567", " 05 :01 03 45:0567", "05:0103 45:0567", "05:0103 45:0 5 6 7","      05:010345:  0567", "05:01:03:45:0567", " 05 :0 1 0 3 4 5:0567      ", " 05 :000 1 0 3 4 5:0567      "...


 
KilkennyCat ©   (2008-09-12 14:49) [40]

а при чем здесь входная строка?
как будет она обрабатываться, дело десятое.



Страницы: 1 2 вся ветка

Текущий архив: 2010.02.28;
Скачать: CL | DM;

Наверх




Память: 0.54 MB
Время: 0.005 c
15-1260991862
KilkennyCat
2009-12-16 22:31
2010.02.28
SQL и куча пользователей.


6-1213512244
sashap
2008-06-15 10:44
2010.02.28
Определение переданной информации TWinSocketStream


1-1238629573
Opilki_Inside
2009-04-02 03:46
2010.02.28
Непонятное поведение accelerator character


2-1261893127
Lyonux
2009-12-27 08:52
2010.02.28
Создание процедуры "копирование"


13-1124785264
Cherrex
2005-08-23 12:21
2010.02.28
CrystalReportViewer и VCL.NET





Afrikaans Albanian Arabic Armenian Azerbaijani Basque Belarusian Bulgarian Catalan Chinese (Simplified) Chinese (Traditional) Croatian Czech Danish Dutch English Estonian Filipino Finnish French
Galician Georgian German Greek Haitian Creole Hebrew Hindi Hungarian Icelandic Indonesian Irish Italian Japanese Korean Latvian Lithuanian Macedonian Malay Maltese Norwegian
Persian Polish Portuguese Romanian Russian Serbian Slovak Slovenian Spanish Swahili Swedish Thai Turkish Ukrainian Urdu Vietnamese Welsh Yiddish Bengali Bosnian
Cebuano Esperanto Gujarati Hausa Hmong Igbo Javanese Kannada Khmer Lao Latin Maori Marathi Mongolian Nepali Punjabi Somali Tamil Telugu Yoruba
Zulu
Английский Французский Немецкий Итальянский Португальский Русский Испанский