Lyra - high-precision multi-band photometric all sky survey

Technical description

The goal of Lyra project is to obtain a high-precision multi-band photometric all-sky survey. The survey aims for completeness to V =17 mag, with accuracies of 1% at extreme magnitude and 0.1% for bright ( up to 12 mag ) stars. The survey will provide positional and photometric measurements for about 400 millions stars in 10 spectral bands (0.2 - 1.0 mkm) using half-meter telescope, mounted on board the Russian segment of the ISS (International Space Station).

The telescope is a Ritchie Chretien type with 500 mm diameter primary mirror, focal distance is 3 meters and field of view is 1.5 degrees. Mosaic of eleven pairs of CCDs (each the size of 2250x300 px) is situated in the focal plane. Ten of them are coupled with interferential filters, corresponding to a selected spectral bands, while one CCD has Antireflection Coating, which provides maximum sensitivity and used as a starmapper.

Observations will be conducted in scanning mode, since ISS orbits around the Earth with permanent orbital orientation - one side of ISS always faces the Earth and the telescope is mounted on the opposite side. Field of view of telescope moves on celestial sphere and sweeps out a zone with width of 1 degree. In average, only half of orbital period when direct sun rays cannot reach the inlet of the telescope, is available for observations.

TDI (Time Delay Integration) mode of CCD (for continuous observations) is provided by positioning of CCDs in the focal plane in a such way, that stars (images) move along columns of CCD. The output is an image of scanning band with width of 1 degree (4500 px) and length of 180 degrees ( about 90000 px). This information (raw data) will be written on removable external storage devices (to be decided later depending on the capacity, mass and reliability), which will be delivered to Earth every half a year with the rest of load (there is no continuous broadband channel between ISS and the Earth).

The project is planned to start in 2013 year with duration of 5 years. For that time all objects on the sky will be observed on average about 100 times (in each spectral band). Objects in the regions close to the celestial poles will be observed 4-5 thousands times.

Scientific tasks

1. Stars
   1.1. Photometrical standards for atmospheric and extraterrestrial observations.
   1.2. Пекулярные (Irregular ?) непеременные звезды. >>  Открытие ?
   1.3. Микропеременность звезд (\Delta m<0.1-0.03).
   1.4. Переменные звезды: создание каталога звезд заподозренных в
   1.5. Переменные звезды: классификация по коротким рядам (меньше
100 наблюдений) многоцветной фотометрии.
   1.6. Эволюция звезд по двух- и многоцветным диаграммам.
   1.7. Поиск фотометрических двойных звезд (выделение двух
максимумов в спектре излучения).
   1.8. Поиск близких красных карликов.
   1.9. Поиск близких бурых карликов.
2. Изучение Галактики.
   2.1. Изучение шаровых скоплений.
   2.2. Изучение рассеянных скоплений.
   2.3. 3D структура Галактики по фотомектрическим параллаксам.
   2.4. Межзвездное поглощение до горячих звезд по наблюдениям в ультрафиолете.
   2.5. 3D структура Галактики по данным о межзвездном поглощении.
   2.6. Многоцветные карты туманностей.
3. Изучение Солнечной Системы.
   3.1. Обнаружение новых малых тел (астероидов).
   3.2. Уточнение орбит известных астероидов.
   3.3. Исследование поверхности малых тел по их многоцветной фотометрии.
4. Околоземное пространство.
   4.1. Многоцветная фотометрия ИСЗ.
   4.2. Регистрация и исследование космического мусора.
5. Астрометрия.
   5.1. Относительные координаты звезд с точностью 0.003" для V<12m и
с точностью 0.01" для V<16m.
   5.2. Параллаксы звезд.
   5.3. Собственные движения звезд.
   5.4. Аномальные смещения объектов.
   5.5. Прямое измерение расстояний до объектов Солнечной системы.
6. Прочее.
   6.1. Построение многоцветной карты фона неба.
   6.2. Метрология фотометрии звезд.
   6.3. Методические вопросы.
   6.4. Старение CCD и интерференционных фильтров в близком космосе.

Data Sets

Raw Data

Data stream per second from 11 pairs of CCDs is estimated as 2*11*2250*300*16=240 Mbit/sec, where 2250 is the CCD width, 300 is a reading frequency of CCD pixels (orbital period of ISS is 1.5 hours, so image of star goes across the shortest side 300 px of CCD in 1 sec ), 16 is a register capacity. So, the total data, obtained during a day is estimated about 180 Gb. This full-scan mode will be used only for small part of celestial sphere, which contain very bright spatial objects, total area about 100 square degrees.

For detection of stars (about 400 mln) the total volume of information obtained in a day is estimated as 30-500 Gb, depending on the stars density on celestial sphere. In this mode, only small part of CCD with a star in the center and of a size of 10x10 px is used. Counts for regions without stars can be averaged and used for estimation of the sky background.

In addition to the scan raw data, auxiliary data include calibration data of sensors, obtained offline using standard source of radiation with known characteristics, telemetric data and time labels for time synchronization. This data stream is estimated at maximum as 30 Kb/sec.

Notice: All data will be compressed (lossless) and decompressed before processing. All estimation of data volume were obtained for non-compressed data.

Summary of raw and auxiliary data:

  • images of stars (or small spatial objects) - record size - 250 b, the number of records - 3-5*10^11, total size is about 100 Tb
  • averaged background records - 10 b, 10^12, 10 Tb
  • full scanning data - 100 Mb, ~ 10^6, 60 Tb
  • calibration data - 15 Mb, 10^4, 150 Gb
  • telemetric data - 10 b, 5*10^9, 50 Gb

Total volume of data, obtained during 5 years, is estimated about 200 Tb. These data are WORM (Write Once Read Many), i.e. information only appended and doesn't deleted or changed.

Scientific data

1. Ожидаемое общее число зарегистрированных объектов: N=100-400 млн. . 2. Среднее число наблюдений одного объекта: S=100-110. 3. Общее число наблюдений объектов O=N*S=1.0-4.4 10^10.

Для уникальной нумерации объектов достаточно I4 (longint), для нумерации наблюдений необходимо I8 (bigint), хотя можно уложиться в 5 байт.

С борта КА данные поступают в виде допускающем легкую группировку наблюдений в различных спектральных полосах. Сгруппированное наблюдение (объект) имеет вид:

  • 11 фрагментов изображений в различных спектральных полосах (размер фрагмента по умолчанию (минимальный) 10х10 пикселей, или больше);
  • информация привязанная к каждому изображению: фон, размер, бининг, положение фрагмента в скане и т.п.;
  • информация привязанная ко всему объекту: время, параметры аппаратуры (из телеметрии).

Обязательные основные операции.

  • 1.Для каждого наблюдения объекта в каждом спектральном диапазоне вычисляются координаты, звездная величина и фон (звездная величина на пиксель или кв.угл.сек.).
  • 2. Производится привязка наблюдений одного и того же объекта в разных сканах.
  • 3. Производится разделение объектов на группы (типы):
    • постоянные звезды умеренной светимости (поток излучения координаты объекта во всех спектральных полосах постоянны в пределах ошибок измерений, переполнения емкости пикселей нет);
    • переменные звезды (координаты объекта постоянны, блеск значимо меняется хотя бы в одном наблюдении и в одной полосе, переполнения емкости пикселей нет);
    • яркие объекты (происходит переполнения емкости пикселей);
    • движущиеся объекты (координаты объекта изменяются);
    • протяженные объекты (берутся из входного каталога протяженных объектов).
  • 4. Каждая группа объектов обрабатывается собственным способом.

Для пп.1-3 сознаются таблицы научных данных. Таблицы могут изменяться, перевычисляться и т.д.

Оценки объема таблиц научных данных.

   1. Таблицы наблюдений (координаты и блеск).
      Длина записи: UID (наблюдения) - I8, 11 x (координаты - 2xR8, блеск -
      1xR8) = 272 b.
      Макс. число записей 4.4x10^10.
      Объем таблицы: 1.2х10^13 b = 12Tb.
   2. Отождествление объектов в сканах. Содержит 2 таблицы: таблицу векторов
      отождествлявший, Map: наблюдение - отождествление.
      - Таблицы векторов.
       Длина записи: UID (объекта) - I4, вектор отождествлений <110>*I8 =
      884 b.
       Макс. число записей 400 000 000 = 4 10^8.
       Объем таблицы: 3.5х10^11 b = 350Gb.
          Длина записи: UID (объекта) - I4, UID (наблюдения) - I8 = 12 b.
          Макс. число записей 4.4 10^10.
          Объем таблицы: 5.3х10^11 b = 530Gb.
      Общий объем таблиц отождествления: 880 Gb.
   3. Таблицы типов объектов.
      Длина записи: UID (объекта) - I4, тип объекта - I1, доп информация -
      I8 = 13 b.
      Макс. число записей 400 000 000 = 4 10^8.
      Объем таблицы: 5.2х10^11 b = 520Gb.

Typical operations

*Типичные действия с данными и операции, требуемые от БД*

1). Внесение данных в БД Данные вносятся в БД крупными блоками (~20Tb) раз в полгода. При их внесении выполняется стандартная обработка (см. ниже) и индексация. Требования к БД: эффективная полная или инкрементальная индексация данных.

2). Наблюдательные данные имеют сложную структуру. Так наблюдения звезды состоят из 11 фрагментов изображений типичным размером 10х10 (возможны бОльшие размеры), + дополнительные данные (фон, температуры, время …) или ссылки на них. Требования к БД: поддержка сложных структур данных (объектов).

3). Необходимо провести отождествления: – одной и той же звезды в разных сканах; – звезд со звездами во внешних каталогах; – звезд с отсчетами фона; – отсчетов фона из разных сканов друг с другом; – момента измерения объекта (звезды, ИСЗ, протяж.объекта, фона) с состоянием аппаратуры на момент измерения (по временнОй телеметрической записи). Требования к БД: эффективное проведение многокритериального (со сложными критериями) и множественного (взаимное отождествление 100-1000 объектов из полного набора 10^8-10^10) кросс-матчинга.

4). Хранение отождествленных кросс-матч последовательностей. Требования к БД: Как эффективнее? Индексы? MAP'ы?

5). Быстрые выборки отождествленных последовательностей для обработки постоянных или переменных звезд и движущихся объектов. Требоания к БД: Эффективная выборка списков (см. п.4).

6). Для выявления систематических зависимостей необходимо эффективное формирование матриц плана для МНК (регрессии). Возможно формирование секционированных матриц для параллельных (кластерных) расчетов. Размеры матриц до 10^11 записей. Требования к БД: Эффективные выборки большого объема.

7) Сэмплирования данных для возможности отлаживания