The goal of Lyra project is to obtain a high-precision multi-band photometric all-sky survey. The survey aims for completeness to V =17 mag, with accuracies of 1% at extreme magnitude and 0.1% for bright ( up to 12 mag ) stars. The survey will provide positional and photometric measurements for about 400 millions stars in 10 spectral bands (0.2 - 1.0 mkm) using half-meter telescope, mounted on board the Russian segment of the ISS (International Space Station).
The telescope is a Ritchie Chretien type with 500 mm diameter primary mirror, focal distance is 3 meters and field of view is 1.5 degrees. Mosaic of eleven pairs of CCDs (each the size of 2250x300 px) is situated in the focal plane. Ten of them are coupled with interferential filters, corresponding to a selected spectral bands, while one CCD has Antireflection Coating, which provides maximum sensitivity and used as a starmapper.
Observations will be conducted in scanning mode, since ISS orbits around the Earth with permanent orbital orientation - one side of ISS always faces the Earth and the telescope is mounted on the opposite side. Field of view of telescope moves on celestial sphere and sweeps out a zone with width of 1 degree. In average, only half of orbital period when direct sun rays cannot reach the inlet of the telescope, is available for observations.
TDI (Time Delay Integration) mode of CCD (for continuous observations) is provided by positioning of CCDs in the focal plane in a such way, that stars (images) move along columns of CCD. The output is an image of scanning band with width of 1 degree (4500 px) and length of 180 degrees ( about 90000 px). This information (raw data) will be written on removable external storage devices (to be decided later depending on the capacity, mass and reliability), which will be delivered to Earth every half a year with the rest of load (there is no continuous broadband channel between ISS and the Earth).
The project is planned to start in 2013 year with duration of 5 years. For that time all objects on the sky will be observed on average about 100 times (in each spectral band). Objects in the regions close to the celestial poles will be observed 4-5 thousands times.
1. Stars 1.1. Photometrical standards for atmospheric and extraterrestrial observations. 1.2. Пекулярные (Irregular ?) непеременные звезды. >> Открытие ? 1.3. Микропеременность звезд (\Delta m<0.1-0.03). 1.4. Переменные звезды: создание каталога звезд заподозренных в переменности. 1.5. Переменные звезды: классификация по коротким рядам (меньше 100 наблюдений) многоцветной фотометрии. 1.6. Эволюция звезд по двух- и многоцветным диаграммам. 1.7. Поиск фотометрических двойных звезд (выделение двух максимумов в спектре излучения). 1.8. Поиск близких красных карликов. 1.9. Поиск близких бурых карликов. 2. Изучение Галактики. 2.1. Изучение шаровых скоплений. 2.2. Изучение рассеянных скоплений. 2.3. 3D структура Галактики по фотомектрическим параллаксам. 2.4. Межзвездное поглощение до горячих звезд по наблюдениям в ультрафиолете. 2.5. 3D структура Галактики по данным о межзвездном поглощении. 2.6. Многоцветные карты туманностей. 3. Изучение Солнечной Системы. 3.1. Обнаружение новых малых тел (астероидов). 3.2. Уточнение орбит известных астероидов. 3.3. Исследование поверхности малых тел по их многоцветной фотометрии. 4. Околоземное пространство. 4.1. Многоцветная фотометрия ИСЗ. 4.2. Регистрация и исследование космического мусора. 5. Астрометрия. 5.1. Относительные координаты звезд с точностью 0.003" для V<12m и с точностью 0.01" для V<16m. 5.2. Параллаксы звезд. 5.3. Собственные движения звезд. 5.4. Аномальные смещения объектов. 5.5. Прямое измерение расстояний до объектов Солнечной системы. 6. Прочее. 6.1. Построение многоцветной карты фона неба. 6.2. Метрология фотометрии звезд. 6.3. Методические вопросы. 6.4. Старение CCD и интерференционных фильтров в близком космосе.
Data stream per second from 11 pairs of CCDs is estimated as 2*11*2250*300*16=240 Mbit/sec, where 2250 is the CCD width, 300 is a reading frequency of CCD pixels (orbital period of ISS is 1.5 hours, so image of star goes across the shortest side 300 px of CCD in 1 sec ), 16 is a register capacity. So, the total data, obtained during a day is estimated about 180 Gb. This full-scan mode will be used only for small part of celestial sphere, which contain very bright spatial objects, total area about 100 square degrees.
For detection of stars (about 400 mln) the total volume of information obtained in a day is estimated as 30-500 Gb, depending on the stars density on celestial sphere. In this mode, only small part of CCD with a star in the center and of a size of 10x10 px is used. Counts for regions without stars can be averaged and used for estimation of the sky background.
In addition to the scan raw data, auxiliary data include calibration data of sensors, obtained offline using standard source of radiation with known characteristics, telemetric data and time labels for time synchronization. This data stream is estimated at maximum as 30 Kb/sec.
Notice: All data will be compressed (lossless) and decompressed before processing. All estimation of data volume were obtained for non-compressed data.
Summary of raw and auxiliary data:
Total volume of data, obtained during 5 years, is estimated about 200 Tb. These data are WORM (Write Once Read Many), i.e. information only appended and doesn't deleted or changed.
1. Ожидаемое общее число зарегистрированных объектов: N=100-400 млн. . 2. Среднее число наблюдений одного объекта: S=100-110. 3. Общее число наблюдений объектов O=N*S=1.0-4.4 10^10.
Для уникальной нумерации объектов достаточно I4 (longint), для нумерации наблюдений необходимо I8 (bigint), хотя можно уложиться в 5 байт.
С борта КА данные поступают в виде допускающем легкую группировку наблюдений в различных спектральных полосах. Сгруппированное наблюдение (объект) имеет вид:
Обязательные основные операции.
Для пп.1-3 сознаются таблицы научных данных. Таблицы могут изменяться, перевычисляться и т.д.
Оценки объема таблиц научных данных.
1. Таблицы наблюдений (координаты и блеск). Длина записи: UID (наблюдения) - I8, 11 x (координаты - 2xR8, блеск - 1xR8) = 272 b. Макс. число записей 4.4x10^10. Объем таблицы: 1.2х10^13 b = 12Tb. 2. Отождествление объектов в сканах. Содержит 2 таблицы: таблицу векторов отождествлявший, Map: наблюдение - отождествление. - Таблицы векторов. Длина записи: UID (объекта) - I4, вектор отождествлений <110>*I8 = 884 b. Макс. число записей 400 000 000 = 4 10^8. Объем таблицы: 3.5х10^11 b = 350Gb. -MAP. Длина записи: UID (объекта) - I4, UID (наблюдения) - I8 = 12 b. Макс. число записей 4.4 10^10. Объем таблицы: 5.3х10^11 b = 530Gb. Общий объем таблиц отождествления: 880 Gb. 3. Таблицы типов объектов. Длина записи: UID (объекта) - I4, тип объекта - I1, доп информация - I8 = 13 b. Макс. число записей 400 000 000 = 4 10^8. Объем таблицы: 5.2х10^11 b = 520Gb.
*Типичные действия с данными и операции, требуемые от БД*
1). Внесение данных в БД Данные вносятся в БД крупными блоками (~20Tb) раз в полгода. При их внесении выполняется стандартная обработка (см. ниже) и индексация. Требования к БД: эффективная полная или инкрементальная индексация данных.
2). Наблюдательные данные имеют сложную структуру. Так наблюдения звезды состоят из 11 фрагментов изображений типичным размером 10х10 (возможны бОльшие размеры), + дополнительные данные (фон, температуры, время …) или ссылки на них. Требования к БД: поддержка сложных структур данных (объектов).
3). Необходимо провести отождествления: – одной и той же звезды в разных сканах; – звезд со звездами во внешних каталогах; – звезд с отсчетами фона; – отсчетов фона из разных сканов друг с другом; – момента измерения объекта (звезды, ИСЗ, протяж.объекта, фона) с состоянием аппаратуры на момент измерения (по временнОй телеметрической записи). Требования к БД: эффективное проведение многокритериального (со сложными критериями) и множественного (взаимное отождествление 100-1000 объектов из полного набора 10^8-10^10) кросс-матчинга.
4). Хранение отождествленных кросс-матч последовательностей. Требования к БД: Как эффективнее? Индексы? MAP'ы?
5). Быстрые выборки отождествленных последовательностей для обработки постоянных или переменных звезд и движущихся объектов. Требоания к БД: Эффективная выборка списков (см. п.4).
6). Для выявления систематических зависимостей необходимо эффективное формирование матриц плана для МНК (регрессии). Возможно формирование секционированных матриц для параллельных (кластерных) расчетов. Размеры матриц до 10^11 записей. Требования к БД: Эффективные выборки большого объема.
7) Сэмплирования данных для возможности отлаживания