База данных на 1 млн. записей

Статус
В этой теме нельзя размещать новые ответы.

svi2009

Местный
Регистрация
13 Дек 2009
Сообщения
8
Реакции
0
Credits
27
Здравствуйте!

Помогите с выбором базы данных за таких условий:
- к-во записей: 1 млн. (в планах до 50 млн.)
- к-во полей: до 30
- информация: текст (списки людей + информация о них);
- задачи: первостепенное - поиск и выборки, второстепенное - редактирование;
- ключевой момент: первостепенный - скорость выборки, второстепенный - размер (в границах 10-30 Гб)
- ОС: Windows
- обслуживание: программа на Delphi;
- локализация: локальная;
- подключение: универсализация (программа + база => скопировал в на другой ПК и запустил без дополнительных настроек и драйверов)

На сегодня проработал 2 варианта:
1) NexusDB - импортнул 300 тыс. записей, проиндексировал по Фамилии
плюс - неплохая скорость выборки на 300 тыс. записях (точный запрос "=" - порядка 10 с., условный "like" - порядка 30 с.) (норма ...)
минус - база уже переваливает за 3 Гб, т.е. на 50 млн. записях это будет порядка 500 Гб (перебор ...)

2) SQLite - импортнул 1 млн. записей, проиндексировал по Фамилии
плюс - небольшой размер базы (около 600 Мб), т.е. на 50 млн. записях это будет порядка 30 Гб (норма ...)
плюс - отличная скорость выборки при точном запросе ("=") - 3-5 с
(супер ...)
минус - при условной выборке ("like") скорость неприемлемая - порядка 5 мин. (перебор ...)

База формируется из txt-файла (экспорт из БД Cronos).

Может я чего-то не учел в SQLite. Под Delphi подключался с помощью DISQLite3 v2.4.5 from Yunga (Для просмотра ссылки Войди или Зарегистрируйся), импортировал txt-файл SQLite Maestro v12.1.0 в ANSI кодировке (кирилица)

Помогите советом или подскажите еще варианты реализации задачи.
 

OnThink

Турист
Регистрация
11 Июл 2004
Сообщения
35
Реакции
1
Credits
52
Like без перебора могут дать только Oracle, MS SQL и может быть DB2 (на счёт неё точно не знаю). Да и то не в переносимых версиях. Для базы таких размеров "переносимая" архитектура, сама по себе, косяк. Подымайте сервис где-нибудь на Amazon EC2 и не морочьте голову.
PS
Правда это будет уже называться не Like, а "полнотекстовый поиск".
 
Последнее редактирование модератором:

mfarouk

Турист
Регистрация
1 Ноя 2012
Сообщения
1
Реакции
0
Credits
2
Oracle or MS Sql , MS Sql 2008 R2 are great
 

kindghost

Турист
Регистрация
28 Апр 2009
Сообщения
7
Реакции
0
Credits
12
Interbase подойдет (сейчас использую на 10 млн записей - проблем нет)
 

vovag3074

Местный
Регистрация
16 Янв 2010
Сообщения
44
Реакции
76
Credits
335
Interbase подойдет (сейчас использую на 10 млн записей - проблем нет)

Firebird подойдет тоже. У самого база с 30 млн. записей. Но по стандарту SQL 92 поиск по условию LIKE безиндексный. Ищу методом SRARTING WITH иначе нужно делать что- то вроде полнотекстового поиска.
 

makermaden

Турист
Регистрация
13 Дек 2012
Сообщения
6
Реакции
0
Credits
8
I'm using SQL Server Express with over 4 million record (world cities table).

A very simple query for autocomplete by city name takes between 5 to 13 ms (3 chars as minimum input).

City name field is obviously indexed.
 

-m-

Турист
Регистрация
8 Янв 2013
Сообщения
4
Реакции
1
Credits
8
MariaDB + sphinx for very quick full text search (about 30ms for 1M row).
Little or no overhead

Добавлено через 1 минуту
... PS I don't know exactly how to index cirillic text, I work on "latin" keymap
 
Последнее редактирование модератором:

Alexander_K

Турист
Регистрация
16 Сен 2010
Сообщения
1
Реакции
0
Credits
2
У многих производителей есть бесплатные версии своих БД, например Oracle, SQL Server и т.д., у них есть какие-то ограничения, но если про это почитать про них, может вы влезете в эти ограничения.
 

LeshaRB

Свой
Регистрация
11 Июн 2007
Сообщения
319
Реакции
467
Credits
25
он же написал

- подключение: универсализация (программа + база => скопировал в на другой ПК и запустил без дополнительных настроек и драйверов)
 

GerholdtSchnaps

Турист
Регистрация
1 Апр 2009
Сообщения
6
Реакции
0
Credits
4
а кто мешает тащить, например, установщик sql server 2008 express (только engine) с собой и при запуске проверять установлен или нет. если нет - ставить молча. способ не самый лучший, но имхо для баз с 1 млн записей и больше мелкие базочки - несерьезно.

И про NexusDB немного - вот до чего ж замороченная БД. Уж лучше CE взять, но для него надо с собой таскать фреймворк.
 

rm822

Турист
Регистрация
15 Сен 2004
Сообщения
5
Реакции
0
Credits
10
я бы предложил sql server 2012 localdb
-20 мб инсталер
-чисто формальная установка - примерно 5 секунд и работает не под администратором
 

ordozz

Турист
Регистрация
8 Апр 2006
Сообщения
3
Реакции
0
Credits
6
Firebird с этим справится без проблем
 

rz3rr

Турист
Регистрация
29 Май 2009
Сообщения
20
Реакции
0
Credits
38
Индексация по Фамилии - это по текстовому полю??? Если да, то за счёт такой индексации размер БД будет огромен. И что за БД, которая на 300 тыс. записях поиск осуществляет за 10 секунд? Походу, архитектура БД построена кривовато. Либо очень слабый комп.
 
Статус
В этой теме нельзя размещать новые ответы.