Быстрое развитие современных коммуникационных технологий, в частности WWW, приводит к их активному проникновению в сферу обмена научными данными. WWW технология исторически возникла как средство обмена именно научной информации, для координации работы многих коллективов и обеспечения доступа к распределенным базам знаний. Однако, подавляющее количество ценной научной информации собирается людьми незнакомыми с WWW-технологиями и хранящими данные на локальных серверах, при этом, как правило, недоступные для интерактивного использования сторонними пользователями.

Общепринятая, в настоящее время, технология построения интерактивых систем работы с распределенными базами данных состоит из собственно БД, обеспечивающая обработку запросов, WWW сервера, и интерфейса пользователя, который предоставляет возможность формирования запроса и передачу последнего БД, а также обеспечивает обратную связь БД -> пользователь, т.е. отображение результатов работы БД.

Проект DATAGEN направлен на облегчение создания WWW-интерфейсов к уже существующим базам данных. Это необходимо для тех пользователей, которые не имеют специальных знаний в области создания WWW-интерфейсов. Стандартный WWW-интерфейс к базе данных должен включать в себя формы для заполнения и редактирования Базы Данных, поисковую систему и систему генерации отчетов. При этом,при использовании DATAGEN автору данных будет достаточно заполнить таблицу, которая содержит информацию о полях базы данных, и далее программа автоматически создаст все необходимые скрипты для работы с базой данных. Такая система позволит упростить создание WWW-интерфейсов к базам данных и сделать их однотипными, что в дальнейшем упростит работу пользователя с этими интерфейсами. Работа с данными подразумевает многоуровневую систему доступа к этим данным. Автор данных (или авторы в случае распределенной системы сбора информации) должны иметь полный доступ к своим данным, т.е. возможность добавлять, редактировать и удалять данные из базы. Администратор базы данных должен иметь возможность изменения структуры базы или описания этой базы. Для пользователя базы данных эти опции должны быть закрыты.

Осуществление этого проекта было разбито на несколько логических этапов:

  1. создание программы, создающей описание базы данных.
  2. создание программной библиотеки, работающей с таблицами описаний
  3. создание программы, автоматически создающей по описанию базы данных и на основе программной библиотеки WWW-интерфейс для редактирования и пополнения базы данных.
  4. создание программы, автоматически создающей на основе описания базы данных поисковый WWW-интерфейс к базе данных.
  5. автоматический интерфейс для генерации отчетов. Отчеты включают в себя информацию о состоянии базы, статистике обращений к базе и т.д.

Проект ориентирован на использование в качестве СУБД PostgreSQL, свободно распространяемая в исходных текстах и неплохо зарекомендовавшая себя в реальной работе.

в качестве языка программирования на котором создается WWW-интерфейс выбран язык Perl, который широко используется в аналогичных проектах.

При создании промежуточных HTML интерфейсов мы ориентировались на стандарты HTML3.2 и HTTP1.1.

К настоящему моменту реализованы WWW-интерфейсы для создания описания баз данных, написана специальная программная библиотека работающая с полями служебных таблиц баз данных и автоматизировано создание простых поисковых интерфейсов.