Astronomía

Quiero una base de datos de recuento de galaxias, también ¿cómo uso SDSS skyserver para buscar galaxias?

Quiero una base de datos de recuento de galaxias, también ¿cómo uso SDSS skyserver para buscar galaxias?

Soy nuevo en todo esto y trato de implementar el conteo de galaxias. Para la etapa inicial Necesito datos de imágenes sin procesar, es decir, imágenes con galaxias y estrellas junto con un recuento de cuántas galaxias hay en la imagen.

Me encontré con esto que parece tener una forma de etiquetar las galaxias.

http://skyserver.sdss.org/dr13/en/tools/chart/navi.aspx?ra=179.68929&dec=-0.45438&opt=

pero no puedo entenderlo en absoluto, Utilicé esta página

http://skyserver.sdss.org/dr13/en/tools/chart/chartinfo.aspx

para tratar de que se etiquete, solo se ven galaxias, pero no obtuve nada (poner G en la sección de opciones, no hizo una diferencia).

¿Alguien sabe cómo operar lo anterior o ¿Dónde podría obtener imágenes con muchas galaxias (cualquier número sería suficiente) en ellas junto con un recuento de cuántas galaxias hay en la imagen?

Encontré https://data.galaxyzoo.org/ pero atravesarlo parece imposible


Puede que la base de datos NED y Astrometry.net le resulten útiles. NED es la base de datos extragaláctica de la NASA. Puede buscar por una posición en el cielo con un radio y le dará una lista de objetos conocidos en ese campo.

Astrometry.net te permite subir imágenes y resolverá lo que estás mirando, brindándote también una lista de objetos conocidos en tu imagen.

Me gusta usar CDS para buscar rápidamente objetos. Esto le permitirá buscar imágenes de diferentes encuestas fácilmente y lo vinculará a otras fuentes sobre ese objeto, así como a publicaciones sobre su objeto.


Introducción a SQL

SQL es el Sestructurado Query Langlo, un medio estándar para solicitar datos de bases de datos y se utiliza para consultar el servidor de archivo de catálogo (CAS). Esta página proporciona una breve descripción general de SQL. También se encuentran disponibles ejemplos de consultas, con comentarios, así como una página de enlaces a documentación externa más detallada.

Fundamentos de bases de datos

Al realizar consultas, primero debe decidir qué base de datos utilizará. Hay dos bases de datos principales en CAS, Target y Best. En el DR4, estas bases de datos se denominan en realidad TARGDR4 y BESTDR4. La base de datos de Target contiene todas las mediciones que se realizaron cuando los objetos se apuntaron para espectroscopía. Best contiene los mejores datos y los procesamientos más recientes para toda el área del cielo liberada. La cobertura de área es casi, pero no exactamente, la misma. De forma predeterminada, las consultas se realizan en la mejor base de datos. Para usar una base de datos diferente, puede usar el .. sintaxis para especificar una tabla en la otra base de datos, por ejemplo:

Para obtener más detalles sobre las diferencias entre Target y Best, consulte la página del modelo de datos.

Cada base de datos contiene una gran cantidad de tablas, algunas de las cuales contienen mediciones fotométricas (como PhotoObj), mediciones espectroscópicas (como SpecObj) o información sobre las condiciones de observación (Field) o la geometría de la encuesta (TileBoundary). Consulte la página del modelo de datos para obtener más detalles.

Además de las tablas, hemos definido Puntos de vista, que son subconjuntos o combinaciones de los datos almacenados en las tablas. Las vistas se consultan de la misma manera que las tablas existen solo para facilitarle la vida. Por ejemplo, la vista Galaxia se puede utilizar para obtener datos fotométricos sobre objetos que clasificamos como galaxias, sin tener que especificar la clasificación en su consulta.

Tanto las interfaces Skyserver como CasJobs tienen una Navegador de esquemas. Le muestra todas las bases de datos disponibles, las tablas en cada base de datos y las cantidades almacenadas en cada columna de las tablas.

Finalmente, hemos creado una variedad de funciones y procedimientos almacenados que le permiten realizar fácilmente algunas operaciones comunes. Por lo general, sus nombres tienen el prefijo F o sp, como en fPhotoStatus o spGetFiberList. La lista completa de funciones y procedimientos de almacenamiento se encuentra en el navegador de esquemas. Tenga en cuenta que algunas funciones son valorado por escalares, lo que significa que devuelven un valor único, mientras que otros (como el de uso común dbo.fGetNearbyObjEq, están valorado en tabla en realidad, devuelven una tabla de datos y no un solo número. Esto es importante al interpretar los datos devueltos y realizar uniones.

Tenga en cuenta la precaución sobre el uso de llamadas a funciones como se indica en la sección Optimización de consultas al intentar realizar consultas que devuelvan una gran cantidad de objetos.

Conceptos básicos de las consultas

Ahora que tenemos una descripción general de la estructura de la base de datos, ¿cómo sacamos los datos? Tendrá que escribir una consulta usando SQL. La consulta más básica consta de tres partes:

  1. A SELECCIONE cláusula, que especifica los parámetros que desea recuperar
  2. A DE cláusula, que especifica las tablas de la base de datos de las que desea extraer los datos
  3. A DÓNDE cláusula, que especifica las limitaciones / predicados que desea colocar en los datos extraídos.

La DÓNDE La cláusula no es necesaria si desea recuperar los parámetros de todos los objetos en una tabla específica, ¡pero esto generalmente será una cantidad abrumadora de datos!

Tenga en cuenta que el lenguaje de consulta es insensible a dividir la consulta en muchas líneas. Tambien es no distingue mayúsculas y minúsculas. Para que las consultas sean más legibles, es una práctica común escribir las distintas cláusulas de consulta en líneas separadas. La Consultas de muestra El botón en la página de consultas de CasJobs proporciona una variedad de ejemplos, ordenados en complejidad. Por ejemplo, para obtener la lista de campos únicos que se han cargado en la base de datos, usamos:

Puede simplemente copiar y pegar esta (o cualquier otra) consulta en la ventana de búsqueda SQL de SkyServer y presionar enviar, o en la ventana de consulta de CasJobs, y presionar el botón enviar.

Si queremos recuperar múltiples parámetros de la base de datos, los separamos con comas:

¡Por supuesto, los parámetros que solicite deben estar incluidos en la (s) tabla (s) que está consultando! Ahora, digamos que queremos magnitudes de todas las galaxias brillantes. Necesitaremos especificar un rango de magnitud para hacer esto:

Aquí, hemos utilizado el DÓNDE cláusula para proporcionar un rango de magnitud. La y El operador se utiliza para requerir que se cumplan varios límites. Esto nos lleva a.

Operadores lógicos y matemáticos simples

No solo podemos poner límites a los parámetros individuales, podemos poner múltiples límites usando operadores lógicos, así como también poner límites a los resultados de las operaciones matemáticas en múltiples parámetros. También podemos recuperar resultados que son combinaciones lógicas de múltiples consultas. Aquí enumeramos los operadores lógicos, de comparación y matemáticos.

Los operadores LÓGICOS son Y,O,NO funcionan de la siguiente manera:

a B a y B a o B
CIERTOCIERTOCIERTOCIERTO
CIERTOFALSOFALSOCIERTO
CIERTONULONULOCIERTO
FALSOFALSOFALSOFALSO
FALSONULOFALSONULO
NULONULONULONULO

Al comparar valores, utilizará los operadores COMPARISON:

menos que > mas grande que <= Menos que o igual a >= Mayor qué o igual a = igual & # 60 & # 62 o! = no es igual

Además de los operadores de comparación, el especial ENTRE La construcción está disponible.
a ENTRE X Y y es equivalente a a & gt = X Y a & lt = y

Similar,
a NO ENTRE X Y y es equivalente a a y

Finalmente, los operadores MATHEMATICAL (tanto numéricos como bit a bit) son:

1

NombreDescripciónEjemploResultado
+ Adición2 + 35
- Sustracción2 - 3-1
* Multiplicación2 * 36
/ División 4 / 22
% Módulo (resto)5 % 41
ENERGÍA ExponenciaciónPOTENCIA (2.0,3.0)8.0
SQRT Raíz cuadradaSQRT (25,0)5.0
abdominales Valor absolutoABS (-5,0)5.0
& Y bit a bit91 & 15
01011011 & 00001111
11
00001011
| O bit a bit32 | 3
00100000 | 00000011
35
00100011
^ XOR bit a bit17 # 5
00010001 # 00000101
20
00010100
-2
AVG PromedioAVG (ModelMag_r)
MIN MínimoMIN (ModelMag_r)
MAX MáximoMAX (ModelMag_r)

Además, las funciones matemáticas y trigonométricas habituales están disponibles en SQL, como COS, SIN, TAN, ACOS, etc.

Consulta de indicadores de bits

Varias tablas SDSS contienen banderas codificadas en bits para indicar varios tipos de información sobre el objeto o la cantidad en cuestión (por ejemplo, PhotoTag y PhotoObj Todas las tablas tienen cada una la banderas campo, SpecObj tiene zAdvertencia banderas, etc.). Esta sección describe cómo puede probar los valores de marca en su consulta. Para consultas de muestra que demuestran el uso de indicadores, consulte las consultas de muestra Errores al usar indicadores, Galaxias elípticas con ajustes de modelo, Muestra de diámetro limitado, Muestra de LRG y Fotometría limpia con indicadores de consulta de muestra para obtener ejemplos sobre cómo usar indicadores.

Comprobando una sola bandera

Para devolver filas para las que se establece la bandera, la sintaxis básica de la restricción es: (columna-bandera & máscara de bits) > 0
y para devolver filas para las que no se establece la bandera: (columna-bandera & máscara de bits) = 0
dónde máscara de bits es el valor binario en el que el bit correspondiente a la bandera es 1 y todos los demás bits son 0. Puede utilizar las funciones de bandera proporcionadas por SkyServer (enumeradas en el navegador de esquemas) para obtener la máscara de bits para una bandera determinada, pero si es escaneando una gran fracción de una tabla grande como PhotoObj, es mejor que no realice una llamada de función para cada fila y, en ese caso, primero debe obtener el valor binario real de la máscara de bits y sustituirlo en su lugar. Esto se describe en la subsección Uso de funciones dbo en su consulta de la sección Optimización de consultas a continuación.

Por ejemplo, para seleccionar objetos para los que se establece el indicador BLENDED en PhotoTag, usaría una consulta como:

y para seleccionar solo los objetos para los que NO está establecida la bandera, use

Comprobando varias banderas

Para seleccionar objetos para los que todas de varios indicadores, genere la máscara de bits combinada agregando las máscaras de bits de indicadores individuales, luego compare el resultado de aplicar un AND a la máscara de bits combinada con la columna de indicadores con la máscara de bits combinada, por ejemplo

Para seleccionar objetos para los que al menos uno de varios indicadores, solo necesita verificar que la operación AND de la máscara de bits combinada con la columna del indicador devuelva un resultado distinto de cero, por ejemplo,

Para seleccionar objetos para los que ninguno de varios indicadores, el resultado de aplicar un AND a la columna del indicador con la máscara de bits combinada debe ser 0, por ejemplo,

Fotometría limpia

La canalización de fotografías SDSS establece una serie de indicadores que indican la calidad de la fotometría para un objeto determinado en el catálogo. Si desea objetos con solo fotometría limpia para la ciencia, debe tener en cuenta que debe filtrar los objetos no deseados usted mismo en su consulta. Esto no se hace automáticamente (por ejemplo, con una vista de la tabla PhotoObjAll). La razón principal es que las restricciones de marca que se requieren para este filtrado a menudo imponen una penalización de rendimiento significativa en su consulta, e incluso pueden invocar el error de búsqueda de marcadores.

Consulte la consulta de muestra de Fotometría limpia para obtener ayuda sobre cómo usar los indicadores de fotometría para seleccionar solo objetos con fotometría limpia.

Excluir valores de datos no válidos

  • El valor de una cantidad que no se ha calculado se establece en -9999.
  • El valor de un error que no se ha calculado se establece en -1000.

Combinaciones: consultas con varias tablas

Es posible que desee obtener cantidades de varias tablas o establecer restricciones sobre las cantidades en una tabla mientras obtiene medidas de otra. Por ejemplo, es posible que desee magnitudes (de PhotoObj) de todos los objetos identificados espectroscópicamente (SpecObj) como galaxias. Para realizar este tipo de consultas, debe utilizar un entrar. Puede unir dos (o más) tablas en las bases de datos siempre que tengan alguna cantidad en común (normalmente un objeto o ID de campo). Para realizar realmente la unión, debe tener una restricción en la cláusula WHERE de su consulta que obligue a que la cantidad común sea igual en las dos tablas.Aquí hay un ejemplo, obteniendo las magnitudes g para las estrellas en campos donde el ajuste PSF funcionó bien:

Observe cómo definimos las abreviaturas para los nombres de las tablas en la cláusula FROM, esto no es necesario, pero permite escribir mucho menos. Además, no es necesario que solicite la devolución de cantidades de todas las mesas. Tú deber especifique todas las tablas en las que coloca restricciones (incluida la combinación) en la cláusula FROM, pero puede usar cualquier subconjunto de estas tablas en SELECT. Si utiliza más de dos mesas, no es necesario unir todas en la misma cantidad. Por ejemplo, esta combinación de tres vías es perfectamente aceptable:

El tipo de combinaciones que se muestran arriba se denominan uniones internas. En los ejemplos anteriores, solo devolvemos aquellos objetos que coinciden entre las múltiples tablas. Si queremos incluir todas las filas de una de las tablas, independientemente de si coinciden o no con otra tabla, debemos realizar una unión externa. Un ejemplo es obtener datos fotométricos de todos los objetos, mientras se obtienen los datos espectroscópicos de aquellos objetos que tienen espectroscopía.

En el siguiente ejemplo, realizamos un izquierda combinación externa, lo que significa que obtendremos todas las entradas (independientemente de la coincidencia) de la tabla en el lado izquierdo de la combinación. En el siguiente ejemplo, la combinación está activada. P.objID = s.BestObjID por lo tanto, obtendremos todos los objetos fotométricos (P), con datos de la espectroscopía si existe. Si no hay datos espectroscópicos para un objeto, todavía obtendremos las medidas fotométricas pero tendremos valores nulos para la correspondiente espectroscopia.

Puede unirse en más de una mesa, siempre y cuando cada pareja a la que se une tenga una cantidad en común, no es necesario que todas las mesas se unan en la misma cantidad. Por ejemplo:

Observe cómo se unen Field y PhotoObj en el fieldID, mientras que la unión entre Field y Segment usa ID de segmento.

Manipulación de la salida de la consulta

SQL proporciona varias formas de reordenar, agrupar u organizar el resultado de sus consultas. Algunas de estas opciones son:

    contar: Solo dime cuántos objetos devolvería mi consulta. Ejemplo:

Puede usar esto para contar cuántos de cada tipo de objeto se cargan como objetos fotométricos primarios, por ejemplo:

Optimización de consultas

Es fácil construir consultas muy complejas que pueden tardar mucho en ejecutarse. Al escribir consultas, a menudo se pueden reescribir para que se ejecuten más rápido. A esto se le llama optimización.

El primer truco de optimización, y el más trivial, es utilizar el mínimo Mesa o Vista para su consulta. Por ejemplo, si todo lo que te importa son las galaxias, usa la Galaxia ver en su cláusula FROM, en lugar de PhotoObj. También hemos creado una versión en 'miniatura' de PhotoObjAll, llamada PhotoTag. Esta miniatura contiene todos los objetos en PhotoObjAll, pero solo un subconjunto de las cantidades medidas. Usar la tabla PhotoTag para acelerar la consulta solo tiene sentido si NO desea parámetros que solo estén disponibles en el PhotoObjAll completo.

Es extremadamente útil pensar en cómo una base de datos maneja las consultas, en lugar de intentar escribir una lista secuencial y simple de restricciones. NO todas las consultas que sean sintácticamente correctas serán necesariamente eficientes, ¡el optimizador de consultas incorporado no es perfecto! Por lo tanto, escribir consultas de manera que utilicen los trucos siguientes puede producir mejoras de velocidad significativas.

Aquí hay un ejemplo asombroso de la importancia de la optimización:
Encuentre las posiciones y magnitudes de los objetos fotométricos que han sido seleccionados para espectroscopía como posibles QSO.

El primer instinto de un usuario sería obtener los objetos deseados de la tabla PhotoObj dentro de la base de datos TARGDR4 (que contiene la información, incluidas las decisiones de orientación, para los objetos cuando fueron apuntados (elegidos) para espectroscopia). Entonces, esta consulta podría verse así:

Eso es realmente simple: todo lo que está haciendo es verificar si el objetivo principal marca (primo objetivo) se establecen para los dos tipos de objetivos de QSO. Esta consulta puede llevar horas, ¡porque se requiere un escaneo secuencial de cada objeto en la base de datos fotométrica!

Un cambio rápido que marca la diferencia es simplificar la cláusula WHERE, para deshacerse de la o, enmascarando todo menos los bits 2,4 y comprobando si el resultado es distinto de cero. Esto cambia la cláusula WHERE a:

Esto ayuda un poco, pero no mucho; todavía estamos escaneando toda la tabla PhotoObj. Podemos mejorar mucho nuestras vidas si nos damos cuenta de que los desarrolladores de la base de datos han anticipado que las personas estarán interesadas en orientar la información y crearon una tabla más pequeña. TargetInfo, eso contiene solo la Objetivoted, que es un pequeño subconjunto de toda la base de datos fotométrica. Usando esta tabla, podemos reescribir nuestra consulta como (también necesitamos una combinación con la tabla Target):

Tenga en cuenta que la mayor parte de la cláusula WHERE se realiza utilizando el Targetinfo tabla, el optimizador de SQL reconoce inmediatamente que esta tabla es mucho más pequeña que PhotoObj y realiza esta parte de la búsqueda primero. La consulta ahora se ejecuta en aproximadamente uno o dos minutos. ¡Eso es una mejora de dos órdenes de magnitud con respecto al método inicial!.

Finalmente, podemos reconocer que todas las cantidades de interés también están en la tabla PhotoTag, que contiene todos los objetos en PhotoObjAll, pero no todas las cantidades medidas. La consulta será:

Esto se ejecuta en 18 segundos y devuelve las mismas 32931 filas. ¡Otro factor de dos en velocidad! Tenga en cuenta que PhotoTag no contiene el simplificado I magnitud, y debemos usar ModelMag_i en su lugar.

Otra de las formas más sencillas de hacer consultas más rápidas es realizar primero una consulta utilizando solo cantidades indexadas y luego seleccionar esos parámetros del subconjunto de objetos devueltos. Una cantidad indexada es aquella en la que se ha calculado efectivamente una tabla de búsqueda, de modo que el software de la base de datos no tiene que realizar una búsqueda secuencial que consume mucho tiempo a través de todos los objetos de la tabla. Por ejemplo, las coordenadas del cielo cx, cy, cz se indexan utilizando una malla triangular jerárquica (HTM). Por lo tanto, puede hacer una consulta más rápida reescribiéndola de manera que esté anidada, la consulta interna toma toda la fila para los objetos de interés según las cantidades indexadas, mientras que la consulta externa obtiene las cantidades específicas deseadas.

Usar Views es conveniente, pero.
  • Dado que una vista es solo un subconjunto virtual de una tabla, cada consulta en una vista es en realidad una consulta en la tabla subyacente. Esto significa, por ejemplo, cuando realiza una consulta en el Estrella vista de la tabla PhotoObjAll, la consulta aún explora la tabla PhotoObjAll o sus índices. No hay ninguna entrada física persistente en la base de datos correspondiente a la vista de estrella que no sea su definición. En otras palabras, no hay ningún beneficio de rendimiento al usar una vista, es solo una conveniencia conceptual.
  • Las sugerencias de tabla se ignoran si está utilizando una vista en lugar del nombre de la tabla en la cláusula FROM. Las sugerencias se pueden incluir mediante la sintaxis "WITH (& lthintname & gt [= & ltvalue & gt])". Por ejemplo, si dices "SELECT. FROM Galaxy WITH (nolock)", la sugerencia de nolock se ignora. Esto es especialmente importante para la sugerencia INDEX, que deberá utilizar para evitar el problema de búsqueda de marcadores que se describe a continuación.
  • Para las vistas de la tabla PhotoObjAll, como se describe a continuación, es mejor que utilice la tabla PhotoTag en su lugar si la consulta cubre una gran fracción de la tabla (millones de filas de resultados).
Uso de vistas de la tabla PhotoObjAll vs PhotoTag
  • La tabla de etiquetas de fotos más delgada es considerablemente más rápida de escanear porque se pueden cargar más filas en el caché a la vez en comparación con la tabla de fotoobjall mucho más amplia (recuerde que las vistas de fotoobjall restringen el número de filas seleccionadas de la tabla pero no las columnas).
  • Si está accediendo a columnas no indexadas en su cláusula WHERE, probablemente causará una búsqueda de marcadores muy ineficiente debido a un error del optimizador del servidor SQL; en este caso, la solución requerirá que desactive el uso de índices y realice un escaneo completo de la tabla. Esto es una pista para el optimizador que se ignora si está utilizando una vista en lugar de una tabla. Además, la tabla de etiquetas fotográficas más delgada será mucho más rápida de escanear que la tabla de fotoobjall de todos modos.

Esta consulta invoca el error de búsqueda de marcadores y tarda varias horas en ejecutarse como está escrito anteriormente, si se elimina el TOP 100. Si se reescribe para usar la tabla PhotoTag dos veces, en lugar de la vista Star y la vista PhotoObj, entonces no realiza una búsqueda de marcadores y se ejecuta en un poco más de 2 horas en DR2. Tenga en cuenta que las magnitudes taquigráficas u, g, r, i, z y los errores asociados deben reemplazarse con los nombres completos de modelMag ya que PhotoTag no tiene las magnitudes taquigráficas.

Usando funciones dbo en su consulta

En este caso, sería mejor hacer primero la consulta previa:

para obtener el valor de la máscara de bits para esa bandera y luego reescribir la consulta anterior como:

Esto evitará la llamada de función repetida en forma inútil para todos y cada uno de los photobj de la tabla.

Desempeño e índices

El rendimiento suele ser solo un problema cuando la tabla PhotoObjAll (y las vistas asociadas) están involucradas en una consulta, ya sea directamente o con una combinación. Hemos incorporado algunas funciones para mejorar el rendimiento de las consultas en esta tabla. El primero y más importante, y el potenciador de rendimiento más eficaz, es el índice espacial Hierarchical Triangular Mesh (HTM) que hemos desarrollado en JHU e incorporado en cada una de las bases de datos de SDSS. Se trata de un índice multidimensional que acelera las búsquedas por descomposición espacial del cielo.

Además del HTM, hay varios índices construidos en la base de datos en columnas de las diversas tablas, incluida la clave principal, la clave externa y otros índices que agrupan columnas de uso frecuente.
Haga clic aquí para ver una tabla de todos los índices actuales definidos en los datos.

PhotoTag es un subconjunto del 10% de PhotoObjAll que tiene los 60 campos más "populares".

Tanto PhotoObj como PhotoTag están indexados y esos índices son cada uno un subconjunto del 2% de PhotoObj.

Lo bueno de los índices es que se seleccionan automáticamente y se ejecutan 50 veces más rápido que leer toda la tabla PhotoObj y 5 veces más rápido que leer la tabla PhotoTag.

La próxima versión del producto de base de datos SQL Server nos permitirá eliminar PhotoTag (será un índice seleccionado automáticamente). Pero por ahora, los cognoscenti tendrán que usarlo si pueden (si su pregunta está cubierta por ese 10% de los campos más populares).

En un mundo ideal, no tendrías que conocer los índices. Desafortunadamente, no vivimos en un mundo ideal (todavía).

La estrategia para seleccionar algunos objetos (menos de 10,000) en una cierta parte del cielo usando la función dbo.fGetObjFromRect () funciona muy bien. Pero, cuando el parche se vuelve GRANDE (más de 10,000 objetos), entonces su predicado de límite de ra-dec probablemente será más eficiente porque será un escaneo lineal sobre los datos.

Las estrellas / Galaxy / PhotoPrimary /. Todas las vistas se benefician de los índices de las tablas base. Debería sentirse libre de usarlos.

Error de búsqueda de marcadores del optimizador de SQL

La tabla PhotoObjAll es, con mucho, la tabla más grande de la base de datos, por lo que las consultas en esta tabla (y sus vistas aliadas) son las únicas que serán demasiado lentas en determinadas circunstancias. A las velocidades actuales del disco (

400 MB / s máximo), debería tardar aproximadamente 15 minutos para hacer un escaneo secuencial de toda la tabla PhotoObjAll en la base de datos BESTDR1 (300+ GB), y aproximadamente 30 minutos para BESTDR2..PhotoObjAll (700 GB), en un servidor descargado. Por lo tanto, incluso las consultas que escanean toda la tabla de photoobj deberían ejecutarse en aproximadamente media hora si no solicitan una gran cantidad de filas (en cuyo caso se necesita mucho tiempo para recuperar los resultados a través de la red).

A veces, las consultas pueden ejecutarse mucho más lento de lo normal (5-10 veces más lento) si el servidor está cargado, por lo que siempre debe intentar una consulta lenta en diferentes momentos.

Si después de aplicar los consejos dados anteriormente y hacer todo lo posible para optimizar su consulta, encuentra que todavía se ejecuta muy lentamente (no se devuelve ningún resultado en más de una hora aproximadamente, o se agota el tiempo de espera de su consulta), es posible que se haya encontrado con el temido error de búsqueda de marcadores del optimizador de consultas de SQL Server. Básicamente, esto significa que el optimizador ha elegido el plan incorrecto para ejecutar la consulta.

Si bien no existe una forma confiable de predecir qué causa que se invoque el error de marcador, generalmente ocurre cuando hay varias restricciones en cantidades no indexadas en una tabla determinada. Por ejemplo, en la consulta

Si incluye solo una de las dos restricciones separadas por "y", el optimizador elegirá el plan correcto, pero si incluye ambas cosas, el optimizador se equivoca a lo grande y opta por hacer una búsqueda aleatoria de la tabla PhotoObj en lugar de un escaneo secuencial. Decide que usará el índice de clave primaria de photoobj y para cada entrada en el índice, seguirá el enlace a los datos (el "marcador") y buscará las banderas y los campos rowv, colv de la página de datos. Esto significa un acceso al disco aleatorio para cada objeto en la tabla photoobj. Naturalmente, esto será terriblemente lento, ya que el acceso aleatorio es varias veces más lento que el acceso secuencial en discos.

Si, en cambio, el optimizador eligió un escaneo secuencial de toda la tabla de photoobj, la consulta podría completarse en media hora (suponiendo que el servidor no esté mal cargado). Pero con el plan elegido, ¡tomará horas, si no días! Si sospecha que el optimizador está eligiendo el plan incorrecto, la forma de evitarlo es forzar al optimizador a ignorar todos los índices definidos en esa tabla. Por ejemplo, reescribirá la consulta anterior de la siguiente manera:

  1. Reemplazamos el PhotoObj vista con PhotoObjAll mesa. Esto es necesario porque sugerencias como index = 0 funcionan solo en tablas y se ignoran en las vistas. Esto significa que tenemos que incluir la restricción de modo en la cláusula WHERE para restringir nuestra búsqueda a objetos primarios y secundarios, lo cual se hizo automáticamente cuando seleccionamos la vista PhotoObj.
  2. Agregamos la sugerencia "WITH (index = 0)" que le indica al optimizador que ignore todos los índices definidos en esa tabla (PhotoObjAll). Esto fuerza una exploración secuencial de la tabla y evita los muchos accesos aleatorios necesarios para la búsqueda de marcadores de índice.
¡5 horas vs 5 minutos!

A continuación, se muestra un ejemplo que demuestra la espectacular mejora de la velocidad que proporciona esta solución alternativa. La siguiente es una consulta enviada por Jon Loveday del Centro de Astronomía de la Universidad de Sussex en el Reino Unido:

Esta consulta tarda cinco horas y media en ejecutarse en la base de datos DR2 e implica una búsqueda de marcadores en un índice de etiquetas fotográficas. Si inserta una sugerencia (índice = 0) como se muestra a continuación, se completa en 5 minutos!


Quiero una base de datos de recuento de galaxias, también ¿cómo uso SDSS skyserver para buscar galaxias? - Astronomía

SQL es el Sestructurado Query Langlo, un medio estándar para solicitar datos de bases de datos y se utiliza para consultar el servidor de archivo de catálogo (CAS). Esta página proporciona una breve descripción general de SQL. También se encuentran disponibles ejemplos de consultas, con comentarios, así como una página de enlaces a documentación externa más detallada.

Fundamentos de bases de datos

El CAS proporciona acceso a los datos del catálogo SDSS-III que se almacenan en un sistema de gestión de base de datos relacional (DBMS) para la integridad de los datos y la velocidad de acceso. Los datos se organizan en tablas en una base de datos relacional. SkyServer es el portal web a las bases de datos CAS y le permite enviar consultas SQL para extraer los datos que necesita de estas bases de datos. Sin embargo, normalmente no es necesario especificar en qué base de datos se ejecuta su consulta, ya que SkyServer está configurado de forma predeterminada para enviar sus consultas a una base de datos en particular. Este sitio está configurado para enviar sus consultas a la base de datos BESTDR12, que contiene los mejores datos y los procesamientos más recientes para toda el área del cielo liberada.

La base de datos BESTDR12 contiene una gran cantidad de tablas, algunas de las cuales contienen mediciones fotométricas (como PhotoObj), mediciones espectroscópicas (como SpecObj) o información sobre las condiciones de observación (Field) o la geometría de la encuesta (TileBoundary). Consulte la página del modelo de datos para obtener más detalles.

Además de las tablas, hemos definido Puntos de vista, que son subconjuntos o combinaciones de los datos almacenados en las tablas. Las vistas se consultan de la misma manera que las tablas existen solo para facilitarle la vida. Por ejemplo, la vista Galaxia se puede utilizar para obtener datos fotométricos sobre objetos que clasificamos como galaxias, sin tener que especificar la clasificación en su consulta.

Tanto las interfaces Skyserver como CasJobs tienen una Navegador de esquemas. Le muestra todas las bases de datos disponibles, las tablas en cada base de datos y las cantidades almacenadas en cada columna de las tablas.

Finalmente, hemos creado una variedad de funciones y procedimientos almacenados que le permiten realizar fácilmente algunas operaciones comunes. Por lo general, sus nombres tienen el prefijo F o sp, como en fPhotoStatus o spGetFiberList. La lista completa de funciones y procedimientos de almacenamiento se encuentra en el navegador de esquemas. Tenga en cuenta que algunas funciones son valorado por escalares, lo que significa que devuelven un valor único, mientras que otros (como el de uso común dbo.fGetNearbyObjEq, están valorado en tabla en realidad, devuelven una tabla de datos y no un solo número. Esto es importante al interpretar los datos devueltos y realizar uniones.

Tenga en cuenta la precaución sobre el uso de llamadas a funciones como se indica en la sección Optimización de consultas al intentar realizar consultas que devuelvan una gran cantidad de objetos.

Conceptos básicos de las consultas

Ahora que tenemos una descripción general de la estructura de la base de datos, ¿cómo sacamos los datos? Tendrá que escribir una consulta usando SQL. La consulta más básica consta de tres partes:

  1. A SELECCIONE cláusula, que especifica los parámetros que desea recuperar
  2. A DE cláusula, que especifica las tablas de la base de datos de las que desea extraer los datos
  3. A DÓNDE cláusula, que especifica las limitaciones / predicados que desea colocar en los datos extraídos.

La DÓNDE La cláusula no es necesaria si desea recuperar los parámetros de todos los objetos en una tabla específica, ¡pero esto generalmente será una cantidad abrumadora de datos!

Tenga en cuenta que el lenguaje de consulta es insensible a dividir la consulta en muchas líneas. Tambien es no distingue mayúsculas y minúsculas. Para que las consultas sean más legibles, es una práctica común escribir las distintas cláusulas de consulta en líneas separadas. La Consultas de muestra El botón en la página de consultas de CasJobs proporciona una variedad de ejemplos, ordenados en complejidad. Por ejemplo, para obtener la lista de campos únicos que se han cargado en la base de datos, usamos:

Puede simplemente copiar y pegar esta (o cualquier otra) consulta en la ventana de búsqueda SQL de SkyServer y presionar enviar, o en la ventana de consulta de CasJobs, y presionar el botón enviar.

Si queremos recuperar múltiples parámetros de la base de datos, los separamos con comas:

¡Por supuesto, los parámetros que solicite deben estar incluidos en la (s) tabla (s) que está consultando! Ahora, digamos que queremos magnitudes de todas las galaxias brillantes. Necesitaremos especificar un rango de magnitud para hacer esto:

Aquí, hemos utilizado el DÓNDE cláusula para proporcionar un rango de magnitud. La y El operador se utiliza para requerir que se cumplan varios límites. Esto nos lleva a.

Operadores lógicos y matemáticos simples

No solo podemos poner límites a los parámetros individuales, podemos poner múltiples límites usando operadores lógicos, así como también poner límites a los resultados de las operaciones matemáticas en múltiples parámetros. También podemos recuperar resultados que son combinaciones lógicas de múltiples consultas. Aquí enumeramos los operadores lógicos, de comparación y matemáticos.

Los operadores LÓGICOS son Y,O,NO funcionan de la siguiente manera:

a B a y B a o B
CIERTOCIERTOCIERTOCIERTO
CIERTOFALSOFALSOCIERTO
CIERTONULONULOCIERTO
FALSOFALSOFALSOFALSO
FALSONULOFALSONULO
NULONULONULONULO

Al comparar valores, utilizará los operadores COMPARISON:

menos que > mas grande que <= Menos que o igual a >= Mayor qué o igual a = igual & # 60 & # 62 o! = no es igual

Además de los operadores de comparación, el especial ENTRE La construcción está disponible.
a ENTRE X Y y es equivalente a a & gt = X Y a & lt = y

Similar,
a NO ENTRE X Y y es equivalente a a y

Finalmente, los operadores MATHEMATICAL (tanto numéricos como bit a bit) son:

1

NombreDescripciónEjemploResultado
+ Adición2 + 35
- Sustracción2 - 3-1
* Multiplicación2 * 36
/ División 4 / 22
% Módulo (resto)5 % 41
ENERGÍA ExponenciaciónPOTENCIA (2.0,3.0)8.0
SQRT Raíz cuadradaSQRT (25,0)5.0
abdominales Valor absolutoABS (-5,0)5.0
& Y bit a bit91 & 15
01011011 & 00001111
11
00001011
| O bit a bit32 | 3
00100000 | 00000011
35
00100011
^ XOR bit a bit17 # 5
00010001 # 00000101
20
00010100
-2
AVG PromedioAVG (ModelMag_r)
MIN MínimoMIN (ModelMag_r)
MAX MáximoMAX (ModelMag_r)
INICIAR SESIÓN Logaritmo naturalLOG (petroMag_r)
LOG10 Logaritmo en base 10LOG10 (petroMag_r)
Exp Valor exponencial (mi X )CAD (2,5)12.182494

Además, las funciones matemáticas y trigonométricas habituales están disponibles en SQL, como COS, SIN, TAN, ACOS, etc.

Consulta de indicadores de bits

Varias tablas SDSS contienen banderas codificadas en bits para indicar varios tipos de información sobre el objeto o la cantidad en cuestión (por ejemplo, la tabla PhotoObjAll y la vista PhotoTag tienen cada una la banderas campo, SpecObj tiene zAdvertencia banderas, etc.).

Uno de los usos más importantes de los indicadores de bits es indicar por qué un objeto fue el objetivo de la espectroscopia. Una lista de indicadores de objetivos espectroscópicos está disponible en la página de indicadores de objetivos espectroscópicos DR9.

Esta sección describe cómo puede probar los valores de marca en su consulta. Para consultas de muestra que demuestran el uso de indicadores, consulte las consultas de muestra Errores al usar indicadores, Galaxias elípticas con ajustes de modelo, Muestra de diámetro limitado, Muestra de LRG y Fotometría limpia con indicadores de consulta de muestra para obtener ejemplos sobre cómo usar indicadores.

Comprobando una sola bandera

Para devolver filas para las que se establece la bandera, la sintaxis básica de la restricción es: (columna-bandera & máscara de bits) > 0
y para devolver filas para las que no se establece la bandera: (columna-bandera & máscara de bits) = 0
dónde máscara de bits es el valor binario en el que el bit correspondiente a la bandera es 1 y todos los demás bits son 0. Puede utilizar las funciones de bandera proporcionadas por SkyServer (enumeradas en el navegador de esquemas) para obtener la máscara de bits para una bandera determinada, pero si es escaneando una gran fracción de una tabla grande como PhotoObj, es mejor que no realice una llamada de función para cada fila y, en ese caso, primero debe obtener el valor binario real de la máscara de bits y sustituirlo en su lugar. Esto se describe en la subsección Uso de funciones dbo en su consulta de la sección Optimización de consultas a continuación.

Por ejemplo, para seleccionar objetos para los que se establece el indicador BLENDED en PhotoTag, usaría una consulta como:

y para seleccionar solo los objetos para los que NO está establecida la bandera, use

Comprobando varias banderas

Para seleccionar objetos para los que todas de varios indicadores, genere la máscara de bits combinada agregando las máscaras de bits de indicadores individuales, luego compare el resultado de aplicar un AND a la máscara de bits combinada con la columna de indicadores con la máscara de bits combinada, por ejemplo

Para seleccionar objetos para los que al menos uno de varios indicadores, solo necesita verificar que la operación AND de la máscara de bits combinada con la columna del indicador devuelva un resultado distinto de cero, por ejemplo,

Para seleccionar objetos para los que ninguno de varios indicadores, el resultado de aplicar un AND a la columna del indicador con la máscara de bits combinada debe ser 0, por ejemplo,

Fotometría limpia

Consulte la consulta de muestra de Fotometría limpia para obtener ayuda sobre cómo usar los indicadores de fotometría para seleccionar solo objetos con fotometría limpia.

Excluir valores de datos no válidos

  • El valor de una cantidad que no se ha calculado se establece en -9999.
  • El valor de un error que no se ha calculado se establece en -1000.

Cambiar la precisión de la salida de la consulta

Utilizar el STR (columna,norte,D) Construcción SQL (donde norte es el número total de dígitos y D es el número de posiciones decimales) para establecer la precisión de la columna que solicita su consulta. SkyServer devuelve valores con una precisión predeterminada que se establece para cada tipo de datos, y esto puede no ser suficiente para columnas como ra, dec, etc. Consulte los vecinos seleccionados en ejecución o las consultas de muestra de ejemplo de Quasar uniforme para ver ejemplos de cómo usar STR .

Combinaciones: consultas con varias tablas

Es posible que desee obtener cantidades de varias tablas o establecer restricciones sobre las cantidades en una tabla mientras obtiene medidas de otra. Por ejemplo, es posible que desee magnitudes (de PhotoObj) de todos los objetos identificados espectroscópicamente (SpecObj) como galaxias. Para realizar este tipo de consultas, debe utilizar un entrar. Puede unir dos (o más) tablas en las bases de datos siempre que tengan alguna cantidad en común (normalmente un objeto o ID de campo). Para realizar realmente la unión, debe tener una subcláusula JOIN en la cláusula FROM de su consulta que especifique la cantidad común para que sea igual en las dos tablas. Aquí hay un ejemplo, obteniendo las magnitudes g para estrellas en campos donde el ajuste PSF funcionó bien:

Observe cómo definimos las abreviaturas para los nombres de las tablas en la cláusula FROM, esto no es necesario, pero permite escribir mucho menos. Además, no es necesario que solicite la devolución de cantidades de todas las mesas. Tú deber especifique todas las tablas en las que coloca restricciones (incluida la combinación) en la cláusula FROM, pero puede usar cualquier subconjunto de estas tablas en SELECT. Si utiliza más de dos mesas, no es necesario unir todas en la misma cantidad. Por ejemplo, esta combinación de tres vías es perfectamente aceptable:

El tipo de combinaciones que se muestran arriba se denominan uniones internas. En los ejemplos anteriores, solo devolvemos aquellos objetos que coinciden entre las múltiples tablas. Si queremos incluir todas las filas de una de las tablas, independientemente de si coinciden o no con otra tabla, debemos realizar una unión externa. Un ejemplo es obtener datos fotométricos de todos los objetos, mientras se obtienen los datos espectroscópicos de aquellos objetos que tienen espectroscopía.

En el siguiente ejemplo, realizamos un izquierda combinación externa, lo que significa que obtendremos todas las entradas (independientemente de la coincidencia) de la tabla en el lado izquierdo de la combinación. En el siguiente ejemplo, la combinación está activada. P.objID = s.BestObjID por lo tanto, obtendremos todos los objetos fotométricos (P), con datos de la espectroscopía si existe. Si no hay datos espectroscópicos para un objeto, todavía obtendremos las medidas fotométricas pero tendremos valores nulos para la correspondiente espectroscopia.

Manipulación de la salida de la consulta

SQL proporciona varias formas de reordenar, agrupar u organizar el resultado de sus consultas.Algunas de estas opciones son:

    contar: Solo dime cuántos objetos devolvería mi consulta. Puede especificar un nombre de columna como argumento para la función de recuento o simplemente "*" para referirse a todas las columnas. Realmente no importa (a menos que incluya un calificador DISTINCT, ver más abajo) ya que contará todas las filas que coincidan con su consulta de todos modos. Ejemplo:

Aquí, COUNT devolvería diferentes recuentos dependiendo de la columna que seleccionó, p. Ej.

Puede usar esto para contar cuántos de cada tipo de objeto se cargan como objetos fotométricos primarios, por ejemplo:

Optimización de consultas

Es fácil construir consultas muy complejas que pueden tardar mucho en ejecutarse. Al escribir consultas, a menudo se pueden reescribir para que se ejecuten más rápido. A esto se le llama optimización.

El primer truco de optimización, y el más trivial, es utilizar el mínimo Mesa o Vista para su consulta. Por ejemplo, si todo lo que te importa son las galaxias, usa la Galaxia ver en su cláusula FROM, en lugar de PhotoObj. También hemos creado una versión 'delgada' de PhotoObjAll, llamada PhotoTag. Este subconjunto vertical contiene todos los objetos en PhotoObjAll, pero solo un subconjunto de las cantidades medidas. Usar la vista PhotoTag para acelerar la consulta solo tiene sentido si NO desea parámetros que solo estén disponibles en el PhotoObjAll completo.

Es extremadamente útil pensar en cómo una base de datos maneja las consultas, en lugar de intentar escribir una lista secuencial y simple de restricciones. NO todas las consultas que sean sintácticamente correctas serán necesariamente eficientes, ¡el optimizador de consultas incorporado no es perfecto! Por lo tanto, escribir consultas de manera que utilicen los trucos siguientes puede producir mejoras de velocidad significativas.

Usar índices en su consulta

  1. Índices de clave primaria (PK) - estos también se llaman agrupado índices porque los datos están organizados físicamente (agrupados) en el disco en el orden ascendente de esta clave. Cada tabla tiene exactamente un índice agrupado o PK, construido sobre su clave de búsqueda principal. Para la mayoría de las tablas de datos fotométricos, esta es la objID columna, y para la mayoría de las tablas de datos espectroscópicos, esta es la specObjID columna.
  2. Índices de clave externa (FK) - estos son índices construidos en columnas que definen una relación con otras tablas, p. ej. objID en la tabla SpecObjAll es una clave externa en la tabla PhotoObjAll. Tener índices FK ayuda a acelerar las consultas que incluyen un JOIN entre la tabla SpecObjAll (y sus vistas asociadas) y la tabla PhotoObjAll (y sus vistas).
  3. Índices de cobertura - estos son índices creados en (grupos de) columnas que se utilizan con frecuencia (juntas). Por lo tanto, "cubren" el espacio de búsqueda definido por esas columnas. Pueden ser únicos o no únicos (permitir duplicados).

Si debe buscar en columnas no indexadas además de las indexadas, aún puede beneficiarse al realizar primero una consulta utilizando solo las cantidades indexadas, y luego seleccionar esos parámetros del subconjunto de objetos devueltos. Una cantidad indexada es aquella en la que se ha calculado efectivamente una tabla de búsqueda, de modo que el software de la base de datos no tiene que realizar una búsqueda secuencial que consume mucho tiempo a través de todos los objetos de la tabla. Por ejemplo, las coordenadas del cielo cx, cy, cz se indexan utilizando una malla triangular jerárquica (HTM). Por lo tanto, puede hacer una consulta más rápida reescribiéndola de manera que esté anidada, la consulta interna toma toda la fila para los objetos de interés según las cantidades indexadas, mientras que la consulta externa obtiene las cantidades específicas deseadas.

Usando funciones dbo en su consulta

En este caso, sería mejor hacer primero la consulta previa:

para obtener el valor de la máscara de bits para esa bandera y luego reescribir la consulta anterior como:

Esto evitará la llamada de función repetida en forma inútil para todos y cada uno de los photobj de la tabla.


Astrometria

Una descripción detallada de la calibración astrométrica se da en Pier et al. (2003) (AJ o astro-ph / 0211375). Partes de esa discusión se resumen aquí y en la página de descripción general de la calidad de la astrometría.

  1. Siempre que sea posible, las estrellas detectadas en los CCD r se emparejan directamente con las estrellas del Catálogo de Astrógrafos CCD del Observatorio Naval de los Estados Unidos (UCAC, Zacharias et al.2000), un catálogo astrométrico (eventualmente) de todo el cielo con una precisión de 70 mas límite de catálogo de R = 16, y errores sistemáticos de menos de 30 mas. Hay aproximadamente 2-3 magnitudes de superposición entre UCAC y estrellas insaturadas en los r CCD. Los CCD astrométricos no se utilizan. Para DR1, las franjas 9-12, 82 y 86 usaron UCAC.
  2. Si un escaneo no está cubierto por la versión actual de UCAC, entonces se reduce contra Tycho-2 (Hog et al.2000), un catálogo astrométrico de todo el cielo con una precisión mediana de 70 mas en su límite de catálogo de VT = 11,5, y errores sistemáticos de menos de 1 mas. Todas las estrellas Tycho-2 están saturadas en los CCD r, sin embargo, hay aproximadamente 3,5 magnitudes de superposición entre las estrellas brillantes no saturadas en los CCD astrométricos y el extremo débil de Tycho-2 (8 Frames usa las calibraciones astrométricas para hacer coincidir las detecciones del mismo objeto observada en los otros cuatro filtros. La precisión de la astrometría relativa entre filtros puede, por lo tanto, impactar significativamente los cuadros, en particular la desmezcla de objetos superpuestos, fotometría basada en la misma apertura en diferentes filtros y detección de objetos en movimiento. Para minimizar los errores en la astrometría relativa entre filtros, los CCD u, g, i, yz se calibran contra los CCD r.

Cada escaneo de deriva se procesa por separado. Las seis columnas de la cámara se procesan en una sola reducción. En resumen, las estrellas detectadas en los CCD r si se calibran contra UCAC, o las estrellas detectadas en los CCD astrométricos transformadas en coordenadas r si se calibran contra Tycho-2, se comparan con las estrellas del catálogo. Las transformaciones de las coordenadas de r píxeles a las coordenadas celestes del lugar medio del catálogo (CMP) se derivan utilizando un ajuste de mínimos cuadrados de los medios de ejecución a un modelo de plano focal, utilizando los seis CCD r juntos para resolver tanto el seguimiento del telescopio como el enfoque focal del r CCD. desplazamientos, rotaciones y escalas de planos, combinados con ajustes de spline suavizantes para los residuales intermedios. Estas transformaciones, que comprenden las calibraciones para los r CCD, se aplican luego a las estrellas detectadas en los r CCD, convirtiéndolas en coordenadas CMP y creando un catálogo de estándares astrométricos secundarios. Las estrellas detectadas en los CCD u, g, i y z se comparan luego con este catálogo secundario, y se usa un procedimiento de ajuste similar (cada CCD se ajusta por separado) para derivar transformaciones de las coordenadas de píxeles para los otros CCD fotométricos a CMP celeste. coordenadas, que comprenden las calibraciones para los CCD u, g, i y z.


Ejemplo 4: Fotometría conectada a centros de placa SDSS y SEGUE

A menudo es deseable seleccionar estrellas de un área del cielo donde no todas las estrellas tienen un espectro. La fotometría ugriz sola para una muestra profunda de estrellas es a menudo suficiente para hacer una ciencia significativa de la Estructura Galáctica. Además, a menudo es deseable determinar la "función de selección" de un conjunto de espectros determinados con algún algoritmo de selección de objetivos posiblemente no muy conocido. Por esta razón, a menudo se desea seleccionar imágenes de un área del cielo donde se tienen espectros, incluidos objetos para los que no existen espectros en la misma parte del cielo.

Todos los espectros residen en la base de datos CAS specobjall, incluidos los espectros de huellas de la encuesta principal de SDSS y los espectros SEGUE (junto con otros espectros variados).

Debido a la dificultad para procesar e interpretar imágenes de campo estelar muy enrojecidas de baja latitud y congestionadas con la canalización de fotos SDSS estándar (que fue diseñada para fotometría de galaxias en campos con poca gente), la imagen de SEGUE para DR7 ha sido un número de repetición especial (648)

Para hacer coincidir un espectro SEGUE con su información fotométrica completa (es decir, campos más allá de eso en la tabla sppParams, que a menudo, pero no siempre es suficiente), uno simplemente une la tabla DR7 sppParams con la tabla specobjall con la tabla photoobjall usando bestobjid en la tabla specobjall para unirse al objid en la tabla photoobjall, que la tabla sppParams y la tabla specobjall se unen en specobjid.

Por lo tanto, para hacer coincidir un espectro SEGUE de la tabla specobjall con su información fotométrica correspondiente, se debe hacer esta consulta:

Para consultar información sobre imágenes en torno a un determinado (ra, dec):

Esta consulta devuelve una gran cantidad de objetos (54.301) y es posible que deba 'Enviarla' en lugar de ejecutarla como una consulta 'Rápida' (en casjobs). Una vez que descargue la salida, puede realizar una subselección adicional para obtener solo objetos dentro de 1.49 grados de (ra, dec) = (358.26,36.4) y puede agregar cortes en el color o la magnitud, por ejemplo, arrojar objetos más débiles que 20.5 , que es el límite débil de la muestra espectroscópica. Luego, si, por ejemplo, está examinando la integridad espectroscópica de la muestra subenana F, puede seleccionar más objetos con (gr) _0 entre 0,1 y 0,4 y comparar la densidad de los objetos fotométricos en función de la magnitud con la muestra espectroscópica de F estrellas en las placas 1880 y 1881. De esta manera, se puede obtener información fotométrica para todas las placas SEGUE. Y derivar funciones de selección empírica basadas en la fotometría con los mismos cortes de color que la espectroscopia.


Las bases de datos

Diseño lógico de base de datos

Los datos procesados ​​se almacenan en bases de datos. El diseño de la base de datos lógica consta de objetos fotográficos y espectrográficos. Están organizados en un par de esquemas de copos de nieve. Las vistas de subconjuntos y muchos índices brindan un acceso conveniente a los subconjuntos convencionales (como estrellas y galaxias). Los procedimientos e índices se definen para que las búsquedas espaciales sean cómodas y rápidas.

El diagrama de la base de datos para las bases de datos SDSS DR1

Dado que el software de procesamiento de datos experimentó cambios sustanciales desde que comenzó la encuesta, estamos almacenando dos versiones diferentes de nuestras imágenes procesadas. Primero, almacenamos la versión de los datos procesados ​​congelados en el momento en que se seleccionaron los objetivos para las observaciones espectroscópicas. Esta base de datos se llama TARGDR1, donde DR1 designa el número de versión: Data Release 1.

Cuando los datos se han procesado con la mejor versión disponible del software, estos objetos se almacenan en la base de datos BESTDR1. El esquema de las dos bases de datos es idéntico, y muchos de los objetos aparecen en ambas, pero debido al mejor manejo del ruido, la cantidad de objetos en BESTDR1 es algo mayor.

Diseño físico de la base de datos

SkyServer inicialmente adoptó un enfoque simple para el diseño de bases de datos, y como eso funcionó, nos detuvimos allí. El diseño cuenta con el motor de almacenamiento SQL y el optimizador de consultas para tomar todas las decisiones inteligentes sobre el diseño y el acceso a los datos.

La cantidad total de datos en las dos bases de datos es de 818 GB y el número total de filas supera los 3.400 millones.

Todas las tablas de datos se crean en varios grupos de archivos. Los archivos de la base de datos se distribuyen en un solo volumen RAID0. Cada grupo de archivos contiene varios archivos de base de datos que están limitados a aproximadamente 50 Gb cada uno. Los archivos de registro y la base de datos temporal también se distribuyen en estos discos. SQL Server divide las tablas en todos estos archivos y, por lo tanto, en todos estos discos. Detecta el acceso secuencial, crea los subprocesos de captación previa paralelos y utiliza varios procesadores para analizar los datos tan rápido como los discos pueden producirlos. Al leer o escribir, esto da automáticamente la suma de los anchos de banda del disco (más de 400 MBps de pico, 180 MBps típicos) sin ninguna programación especial del usuario.

Más allá de esta división de grupos de archivos, SkyServer usa todos los valores predeterminados de SQL Server. No hay ninguna afinación especial. Este es el sello distintivo de SQL Server: el sistema tiene como objetivo no tener "botones" para que el rendimiento inmediato sea bastante bueno. SkyServer es un testimonio de ese objetivo.

SkyServer personal

Un subconjunto del 1% de la base de datos SkyServer (aproximadamente 1,3 GB de base de datos SQL Server) puede caber (comprimirse) en un CD o descargarse de la web. Esto incluye el sitio web y todas las fotografías y objetos espectrográficos en un cuadrado de 6 ° del cielo. Este SkyServer personal cabe en computadoras portátiles y de escritorio. Es útil para experimentar con consultas, para desarrollar el sitio web y para dar demostraciones. Esencialmente, cualquier salón de clases puede tener un mini-SkyServer por alumno. Con las mejoras en la tecnología de discos, una gran parte de los datos públicos cabrá en un solo disco para 2005.


La encuesta Sloan Digital Sky. De Big Data a Big Database a Big Compute. Instituto Politécnico Heidi Newberg Rensselaer

P11: Encuentre todas las galaxias elípticas con espectros que tengan una línea de emisión anómala.

P12: Cree un recuento en cuadrícula de galaxias con u-g & gt1 y r & lt21.5 sobre 60 & ltdeclination & lt70 y 200 & ltright ascension & lt210, en una cuadrícula de 2 ', y cree un mapa de máscaras sobre la misma cuadrícula. P13: Crea un recuento de galaxias para cada uno de los triángulos HTM

que satisfacen un determinado corte de color, como 0,7u-0,5g-0,2i & lt1.25 & amp & amp r & lt21.75, lo emiten en una forma adecuada para la visualización. P14: Encuentra estrellas con múltiples medidas y tienen magnitud.

variaciones & gt0.1. Busque estrellas que tengan un objeto secundario (observado en un momento diferente) y compare sus magnitudes. P15: Proporcione una lista de objetos en movimiento consistente con un asteroide. P16: Encuentra todos los objetos similares a los colores de un cuásar en

P17: Encuentra estrellas binarias en las que al menos una de ellas tenga los colores de una enana blanca.

P18: Encuentre todos los objetos dentro de 30 segundos de arco entre sí que tengan colores muy similares: ahí es donde las proporciones de color u-g, g-r, r-I son menores que 0.05m.

P19: Encuentre cuásares con una amplia línea de absorción en sus espectros y al menos una galaxia dentro de los 10 segundos de arco. Devuelve tanto los cuásares como las galaxias.

P20: Para cada galaxia en el conjunto de datos de BCG (galaxia de color más brillante), en 160 & ltright ascension & lt170, -25 & ltdeclination & lt35 cuenta de galaxias dentro de 30 & # 34 que tienen una fotoz dentro de 0.05 de esa galaxia.

P1: Encuentre todas las galaxias sin píxeles insaturados dentro de 1 'de un punto dado de ra = 75.327, dec = 21.023

Q2: Encuentre todas las galaxias con brillo de superficie azul entre y 23 y 25 mag por segundo de arco cuadrado, y -10 & lt latitud supergaláctica (sgb) & lt10, y declinación menor que cero.

P3: Encuentre todas las galaxias más brillantes que la magnitud 22, donde la extinción local es & gt0.75.

P4: Encuentre galaxias con un brillo superficial isofotal (SB) mayor que 24 en la banda roja, con una elipticidad & gt0.5, y con el eje mayor de la elipse con una declinación de entre 30 ”y 60” segundos de arco.

P5: Encuentre todas las galaxias con un perfil deVaucouleours (caída de intensidad r¼ en el disco) y los colores fotométricos consistentes con una galaxia elíptica. El perfil de deVaucouleours

P6: Encuentre galaxias que estén mezcladas con una estrella, genere las magnitudes de galaxias desmezcladas.

P7: Proporcione una lista de objetos con forma de estrella que sean un 1% raros. P8: Encuentra todos los objetos con espectros sin clasificar.

P9: Busque cuásares con un ancho de línea & gt2000 km / sy 2,5 & ltredshift & lt2.7.

P10: Encuentre galaxias con espectros que tengan un ancho equivalente en Ha & gt40Å (Ha es la línea espectral principal del hidrógeno).


Galaxy Color & # 8211 Diseñe y realice su propia investigación

Compatible con PE HS-ESS1-2: el lugar de la Tierra en el universo
Admite DCI ESS1.A: El universo y sus estrellas, Propiedades de onda de PS4.A, PS4.B: Radiación electromagnética
Participa en SEP 1: Hacer preguntas, 3: Planificar y realizar investigaciones, 4: Analizar e interpretar datos, 5: Usar matemáticas y pensamiento computacional, 6: Construir explicaciones, 7: Participar en argumentos a partir de evidencia y CCC 1: Patrones, 6 :Estructura y función
El movimiento y la composición de estrellas y galaxias proporcionan evidencia para la teoría del Big Bang.

Está listo para diseñar su propia investigación cuando haya realizado una observación del color de la galaxia en relación con la forma. Su expedición puede comenzar con la pregunta simple: & # 8220¿Es verdadera mi observación? & # 8221 Por ejemplo, la observación inicial de que la mayoría de las galaxias de tipo Sb son ___ (color) establece una investigación para encontrar más galaxias de tipo Sb y contar cuántas coinciden tu observación.

Empecemos & # 8217s. Comience con el trabajo que hizo al agregar color al diagrama de Hubble y continúe con los pasos que se describen a continuación. Las instrucciones que lo guían a través del proceso de investigación aparecen a continuación y los diarios de los estudiantes (enlaces arriba) brindan orientación para aplicarlos a su propio trabajo.

1 & # 8211 Una buena pregunta

Ya hizo observaciones sobre el fenómeno de los colores de las galaxias y formuló algunas preguntas sobre lo que observó. Aquí es donde comienzan las investigaciones científicas. Las buenas preguntas impulsan investigaciones que ayudan a los científicos a desarrollar modelos, explicaciones y teorías, pero para hacer eso, las preguntas deben ser empíricas y de respuesta.

Respuestas & # 8211 A veces preguntas que antes eran incontestables como & # 8220 ¿A qué distancia está la galaxia más cercana? & # 8221, se pueden responder con mejoras en tecnología. A menudo, las grandes preguntas como & # 8220¿Qué es la materia oscura? & # 8221 son respondidas por un conjunto de conocimientos que se desarrolla a lo largo de décadas de preguntas centradas. Su pregunta debe estar lo suficientemente enfocada para poder responder con los datos y herramientas disponibles.

Empírico & # 8211 Las preguntas científicas que conducen a investigaciones y experimentos pueden explorarse utilizando evidencia que sea mensurable y repetible. Una teoría puede ser lógica y ampliamente aceptada, pero hasta que no se pueda investigar utilizando medidas repetibles, no es empírica. Las mediciones pueden ser tan sencillas como un recuento o requerir un equipo complejo como un espectrógrafo. Una medición que se calcula utilizando otras mediciones es válida siempre que se acuerde el método. Por ejemplo, un promedio matemático es un cálculo bien establecido y acordado.

2 & # 8211 Conozca a su sujeto, conozca sus datos

Por lo general, los investigadores dedican una gran cantidad de tiempo a conocer el tema que están investigando. El objetivo de la investigación de antecedentes es conocer el tema por dentro y por fuera antes de diseñar los métodos del experimento. Aunque estamos acortando este proceso en Expedition & # 8211 Galaxy Colors, necesitamos reflexionar sobre lo que ya sabemos sobre nuestro tema e identificar claramente los datos necesarios para nuestra investigación.

Todos los que participan en esta Expedición están haciendo una pregunta relacionada con la forma y el color de las galaxias. Empiece por registrar lo que sabe sobre el concepto de color en astronomía y sobre las formas de las galaxias. Su instructor puede pedirle que consulte los recursos externos. Hablar de este paso con otros es importante para descubrir errores y recordar información.

A continuación, piense en la pregunta que ha escrito y enumere los datos que necesita para responder esa pregunta. Descubra dónde se encuentran esos datos. Además, identifique el tipo de datos que está recopilando. Si está tomando una medición directamente o registrando una medición que se ha registrado en SkyServer, está utilizando datos cuantitativos. Si los datos son descripciones de una característica para la que no existe una medición numérica, los datos son cualitativos.

3 & # 8211 Escribe una hipótesis e identifica las variables

Debe sentirse lo suficientemente seguro en su conocimiento previo y observaciones previas para formar una posible respuesta a su pregunta de investigación.Si su respuesta es plausible y se puede probar utilizando datos y procedimientos que otros pueden repetir, entonces tiene una hipótesis.

En el caso de esta expedición, lo más probable es que esté escribiendo una hipótesis que predice una conexión entre dos variables, la forma y el color de las galaxias. Una variable es algún rasgo o característica de un experimento que cambia. Tradicionalmente, pensamos en una variable cambiada o manipulada por el investigador como variable independiente, y cualquier otra característica medida para evaluar una respuesta como variable dependiente.

Para la investigación de tipos que estamos haciendo aquí, no hay nada que el astrónomo pueda hacer para cambiar las estrellas o galaxias que está observando. Aunque el modelado por computadora se puede usar para simular fenómenos y realizar investigaciones que identifiquen variables independientes y dependientes, ese no es el caso cuando se trabaja con información de una base de datos grande. Sin embargo, podemos predecir una relación entre dos mediciones. Nos referiremos a estas características, colectivamente, como variables.

Su proyecto de hipótesis debe hacer referencia a cualquier variable que planee medir y hacer una predicción. Es probable que su hipótesis siga uno de estos ejemplos:

• Si el color de la galaxia está relacionado con la forma de la galaxia, entonces ____ (haz una predicción) _____.

• Más de ___ (porcentaje o medida numérica) ____ de galaxias clasificadas como ___ (Tipo de galaxia Hubble) ___ son ___ (color) ___.

• Cuantos más brazos espirales tenga una galaxia, _____ (haga una predicción) ____.

4 & # 8211 Describa sus procedimientos

Recuerde, las buenas investigaciones son repetibles. No solo sus mediciones deben ser accesibles para otros científicos, sino que también deben describirse bien los pasos que debe seguir para adquirir y analizar sus datos. En esta sección, informe sobre:

• cómo planeas recopilar datos

• cómo vas a organizar y analizar los resultados (¿vas a crear gráficos? ¿Qué estadísticas o cálculos usarás?)

• los criterios que utilizará cuando haya terminado para decidir si su hipótesis está respaldada por los datos o no

El último punto mencionado anteriormente puede ser el único que no es obvio. Es esencial que considere ANTES de realizar su experimento o investigación cómo decidirá si los datos apoyan la hipótesis o no. Tenga en cuenta que no usamos las palabras & # 8220 verdadero o falso. & # 8221 Una hipótesis científica es una explicación tentativa que los hallazgos experimentales apoyan o no respaldan. Solo a través de investigaciones repetidas a lo largo del tiempo estas declaraciones obtienen una amplia aceptación. Por lo tanto, piense en los procedimientos y las estadísticas que planea usar y tome una decisión de antemano sobre qué resultados apoyarían su hipótesis.

Si no tiene experiencia con probabilidad y estadística, no tendrá tantas herramientas disponibles para completar este último paso. En este caso, puede crear una declaración simple que describa sus criterios. A continuación, se muestra un ejemplo que usa porcentajes:

Mi hipótesis está respaldada por mis resultados si más del __% de las galaxias elípticas son ___ (color) ___.

Una nota sobre las pruebas de significación estadística

Puede decidir que desea aplicar pruebas estadísticas específicas a sus datos que le permitan informar, de manera estandarizada, el nivel de confianza que tiene de que sus datos están agrupados o distribuidos de formas particulares. Algunos de estos incluyen análisis de varianza, chi cuadrado y pruebas de correlación. Si está familiarizado con estas medidas o su instructor las requiere como parte de su diseño de investigación, debe documentar que está recopilando y manejando su recopilación de datos de manera que le permita completar estas pruebas con confianza.

5 & ​​# 8211 Siga su plan, recopile sus datos

Lo crea o no, el trabajo difícil está terminado. Si ha trabajado cuidadosa y minuciosamente hasta este punto, debería poder seguir adelante con su plan. Si está trabajando con otras personas en proyectos similares, podría ser útil que alguien verifique su trabajo con anticipación para confirmar que todo va según lo planeado. Es importante registrar claramente los datos y mantener copias de seguridad. Buena suerte.

6 & # 8211 Conclusiones & # 8211 Interprete sus resultados

Revise sus datos, gráficos y notas. Las siguientes preguntas le ayudarán a sacar conclusiones de sus resultados:

• ¿Aparecen patrones en mis datos? ¿Qué parece ser cierto cuando reviso mi trabajo?

• ¿Mis dos variables parecen estar relacionadas? Describe la relación lo mejor que puedas con palabras o estadísticas.

• ¿Mi hipótesis está respaldada por los datos?

Este es también el momento de informar sobre cualquier sorpresa. ¿Se reveló algo nuevo? Registre cualquier pregunta nueva que haya surgido como resultado de su investigación.

7- Discusión

Esta etapa es cuando hace una pausa para considerar la investigación como un todo. Piense en cualquier factor que lo haga menos seguro de sus resultados, cosas que haría de manera diferente la próxima vez. Puede que se hayan vuelto obvias nuevas preguntas. Tómese el tiempo para considerar estos aspectos ahora.

• ¿Hay algo en sus datos o procedimientos que le haga menos seguro de sus resultados?

• ¿Puede ver algunas áreas de su diseño de investigación, recopilación o análisis de datos que modificaría la próxima vez?

• ¿Qué nuevas preguntas se presentaron como resultado de su trabajo?

8 & # 8211 Informar, compartir hallazgos y recibir comentarios

La única forma en que otros pueden aprender sobre nueva información y nuevos métodos es compartir resultados. También es una de las formas en que los científicos reciben comentarios e ideas de otras personas que trabajan en su área de estudio, pero con las que es posible que no tengan un contacto frecuente. Organizarlo y presentarlo de tal manera que otros puedan usarlo es el propósito de la comunicación científica. Compartir los resultados es una parte esencial del proceso de investigación.

Todo lo que ha hecho y aprendido como parte de su investigación se convierte en parte de su informe final. Aunque existen muchas formas informales de compartir hallazgos, los científicos se basan principalmente en la publicación de resultados formales en revistas de investigación dedicadas a su área de estudio y presentaciones en conferencias científicas. Es posible que su instructor quiera que informe sus resultados de una manera que refleje uno de estos formatos: el artículo científico, un póster o una presentación oral. Cualquiera que sea el método elegido, debe fluir sin problemas a partir del trabajo que ha realizado.

Se proporcionan recursos para comprender cada uno de estos formatos & # 8212 & # 8212-.


Volúmenes de datos públicos

SciServer hace que varios conjuntos de datos estén disponibles directamente en SciServer Compute en forma de Volúmenes de datos públicos. Para utilizar estos volúmenes de datos en sus actividades de investigación o educación, deberá montarlos en un contenedor virtual en el momento de crear ese contenedor. Consulte las instrucciones sobre cómo crear un nuevo contenedor para aprender a montar un volumen de datos públicos.

Datos espectroscópicos de Sloan Digital Sky Survey (SDSS Spectra)

Si tiene una cuenta de SciServer, puede ver el contenido de este volumen de datos en su Tablero yendo a la Archivos pestaña, o con este enlace directo a SDSS Spectra Data Volume (solo para usuarios registrados). Los datos del catálogo de los mismos espectros también están disponibles en SciServer ver Datos de archivo del catálogo de Sloan Digital Sky Survey debajo Bases de datos debajo.

Para utilizar los datos espectroscópicos de SDSS en su trabajo en SciServer Compute, cree un nuevo contenedor y marque la casilla para montar el Espectros SDSS en su contenedor.

Acerca de los datos

Las observaciones provienen de la encuesta espectroscópica de oscilación de bariones extendida (eBOSS) del componente SDSS & # 8217s, que ha medido espectros ópticos (3600-10400 Ångstroms) para millones de galaxias y quásares.

Los espectros individuales están disponibles como archivos FITS. Cada archivo sigue la estructura de la SDSS spec-lite formato de archivo, que contiene el espectro codificado (HDU 1 COADD), la fila spAll (HDU 2 SPALL) y la fila spZline (HDU 3 SPZLINE) & # 8211, pero no las exposiciones individuales (HDU 4+), que están disponibles solo a través del equivalente completo Especificaciones archivos en Science Archive Server.

Para obtener una descripción completa del formato de archivo, consulte la documentación de los archivos de especificaciones de SDSS del modelo de datos de SDSS.

También se puede acceder a los mismos archivos FITS a través del sitio web de SDSS Science Archive Server, junto con muchos archivos relacionados que describen varios aspectos del modelo de datos espectroscópicos de SDSS.

Estructura del volumen de datos

El nivel raíz del volumen de datos contiene el directorio único spec-lite, lo que indica que los contenidos son archivos de especificación SDSS. El siguiente nivel organiza los datos por run2d, que indica qué versión de la tubería espectroscópica SDSS se ha ejecutado para procesar los espectros en esa subcarpeta. Debido a que diferentes encuestas y programas utilizaron diferentes versiones de canalización, el número de ejecución indica cuándo y por qué se recopilaron los espectros.

Los espectros más recientes provienen de SDSS Data Release 16 y tienen el valor run2d v5_13_0 la mayoría de los usuarios querrán esta versión. La siguiente lista muestra qué valores de run2d corresponden a qué conjuntos de datos.
Dentro de cada directorio run2d, los espectros están organizados por la placa SDSS utilizada para la medición, cada directorio basado en placas contiene 640 o 1000 archivos FITS, uno para cada espectro recopilado por la placa.

Guía de números run2d

  • v5_13_0 contiene todos los espectros ópticos publicados como parte de la publicación de datos 16
  • v5_10_0 contiene todos los espectros ópticos publicados como parte del lanzamiento de datos 14
  • 104 contiene todos los espectros ópticos recopilados por la encuesta SDSS SEGUE-2 en 2008-2009, y algunos otros datos espectroscópicos preliminares recopilados en el mismo período, publicados por primera vez en DR7
  • 103 contiene todos los espectros ópticos recopilados por la encuesta SDSS SEGUE-1 y los estudios de grupo # 8217s en 2004-2008 (parte de DR7)
  • 26 contiene todos los demás espectros ópticos de SEGUE-1 y el SDSS Legacy Survey original, observado 2000-2008 y publicado en DR7

La siguiente consulta proporciona datos resumidos sobre cada una de estas ejecuciones, incluida la encuesta SDSS y el programa responsable de los datos:

Astrofísica de alta energía (HEASARC)


El volumen de datos HEASARC contiene una copia de todos los datos públicos alojados en el Centro de Investigación del Archivo Científico de Astrofísica de Alta Energía (HEASARC). Para obtener información sobre las diversas misiones disponibles y cómo usar conjuntos de datos específicos, consulte el sitio web de HEASARC y / o comuníquese con nuestro servicio de asistencia desde ese sitio y el enlace de comentarios # 8217 en la parte inferior.

El volumen de datos HEASARC también incluye un área de software para diversas cosas adicionales, como libros de cocina interactivos que están en desarrollo. Algunas instrucciones de inicio se pueden encontrar en la página de documentación de HEASARC SciServer. El entorno de software para analizar estos datos se puede encontrar en Compute Image llamada HEASARCv6.28.

Simulaciones cosmológicas de Indra


Indra es un conjunto de simulaciones cosmológicas de cuerpos N de gran volumen. Cada una de las 384 simulaciones se calcula con los mismos parámetros cosmológicos y diferentes fases iniciales, lo que proporciona excelentes estadísticas de las características a gran escala de la distribución de la materia oscura.

Los volúmenes independientes tienen 1024 3 partículas de materia oscura en una caja de 1 Gpc / h de longitud, y todos son accesibles a través de contenedores SciServer Compute para todos los usuarios que se unen al dominio de la ciencia de la cosmología. Se puede encontrar una descripción completa del conjunto de simulaciones de Indra en un artículo de Falck, et al (2021).

Los volúmenes de datos de Indra contienen, para cada simulación:

  • 64 instantáneas de posiciones y velocidades de partículas
  • 64 instantáneas de catálogos de halo FOF y SUBFIND
  • 505 pasos de tiempo de campos de densidad de espacio de Fourier de cuadrícula gruesa

Se accede a los datos de Indra con el paquete de python indra-tools preinstalado en la imagen de cálculo de Simulaciones Computacionales. El repositorio git de indra-tools contiene cuadernos de ejemplo que muestran cómo leer los datos binarios, consultar las tablas de la base de datos de halo, calcular campos de densidad, etc.

El uso del conjunto de datos de Indra está abierto y disponible para cualquier persona. Pedimos que las publicaciones científicas que hacen uso de Indra citen el artículo de divulgación de datos de Falck, et al (2021).

Servidor de archivo de datos Sloan Digital Sky Survey (SDSS DAS)

Este volumen contiene todos los datos sin procesar y procesados ​​basados ​​en archivos del Data Release 7 (DR7) de Sloan Digital Sky Survey (SDSS). Los productos de datos espectroscópicos y de imágenes sin procesar y procesados ​​en canalización están disponibles aquí (principalmente) en formato binario FITS.

Se puede acceder a los datos del volumen SDSS-DAS a través de SciServer Compute utilizando las herramientas estándar de Python de acceso a archivos. También se puede acceder a una copia de estos datos a través del sitio web de SDSS DAS, y la versión del catálogo de estos datos está disponible en SDSS DR7 SkyServer.

Espectros de la unidad de campo integral (IFU) SDSS MaNGA

Recuento2

Recount2 proporciona datos de expresión procesados ​​y resumidos para más de 70.000 muestras de secuencia de ARN humano del proyecto Sequence Read Archive (SRA), The Cancer Genome Atlas (TCGA) y The Genotype-Tissue Expression (GTEx) (https://doi.org /10.1038/nbt.3838).

El paquete Bioconductor asociado proporciona una API conveniente para consultar, descargar y analizar los datos. Cada estudio procesado consta de datos de meta y fenotipo, los niveles de expresión de genes y sus exones subyacentes y uniones de corte y empalme, y la correspondiente anotación genómica. Al ocuparnos de varios pasos de preprocesamiento y combinar muchos conjuntos de datos en un sitio web de fácil acceso, hacemos que la búsqueda y el análisis de datos de RNA-seq sean considerablemente más sencillos.

Bases de datos de turbulencia de Johns Hopkins

Modelos de circulación oceánica de Johns Hopkins

SciServer aloja la salida del modelo numérico de modelos de circulación general oceánica (GCM) de alta resolución establecidos y ejecutados por el grupo de investigación del profesor Thomas WN Haine (Universidad Johns Hopkins - Departamento de Ciencias de la Tierra y Planetarias) .Estos modelos permiten a los usuarios rastrear el evolución física de las corrientes oceánicas en órdenes de magnitud en el espacio y el tiempo, y analizar rápidamente aspectos importantes de los eventos del modelo junto con datos de observación.

El objetivo del caso de usuario de SciServer Ocean Modeling es crear un entorno de uso compartido colaborativo donde los usuarios puedan acceder y procesar conjuntos de datos de alta resolución. El análisis de estos grandes conjuntos de datos a menudo está restringido por recursos computacionales limitados, por lo que hemos desarrollado OceanSpy, un paquete de Python que facilita la extracción de información de los campos de salida del modelo. Los usuarios de SciServer pueden descargar subconjuntos de datos en sus propias máquinas o ejecutar nuestras herramientas en línea y almacenar archivos de posprocesamiento en nuestros servidores.

Conjuntos de datos disponibles

Referencias

  • Almansi, M., T.W. Haine, R.S. Pickart, M.G. Magaldi, R. Gelderloos y D. Mastropole, 2017: Variabilidad de alta frecuencia en la circulación e hidrografía del desbordamiento del estrecho de Dinamarca a partir de un modelo numérico de alta resolución. J. Phys. Oceanogr., 47, 2999–3013, https://doi.org/10.1175/JPO-D-17-0129.1.
  • Marcello G. Magaldi, Thomas WN Haine, Simulaciones hidrostáticas y no hidrostáticas de aguas densas que caen en cascada desde una plataforma: El caso de Groenlandia Oriental, Deep Sea Research Part I: Oceangraphic Research Papers, Volumen 96, 2015, Páginas 89-104, ISSN 0967 -0637, https://doi.org/10.1016/j.dsr.2014.10.008.

NUEVO: Datos asociados a SDSS

El nuevo Datos asociados a SDSS El volumen de datos proporciona un fácil acceso a conjuntos de datos útiles de Sloan Digital Sky Survey que no forman parte de las publicaciones oficiales de datos de SDSS (la última de las cuales es ahora la publicación de datos 16).

Actualmente, este volumen de datos incluye el único conjunto de datos que se describe a continuación. Continuaremos agregando nuevos conjuntos de datos, incluidos futuros catálogos de valor agregado de SDSS.

HI-MaNGA: observaciones de seguimiento HI de galaxias objetivo MaNGA

El conjunto de datos HI-MaNGA consiste en observaciones de seguimiento de galaxias MaNGA en la longitud de onda HI (21 cm), utilizando el Telescopio Green Bank. Las observaciones fueron diseñadas para abordar cuestiones científicas relacionadas con la evolución estelar y la acumulación de gas en varios tipos de galaxias. El conjunto de datos final incluirá la mayoría de las galaxias en el catálogo de MaNGA con z & lt 0.05.

Para obtener más información sobre el conjunto de datos HI-MaNGA, consulte su página de descripción en el sitio web de SDSS.


Pregunta 10

La capacidad de un tipo espectral estelar para mantener la vida depende de las condiciones que son características del tipo. Los elementos, gases y compuestos comunes presentes dentro de un determinado espectro determinan si realmente puede sustentar vida o no. Un tipo espectral que sostiene la vida es lo suficientemente luminoso y tiene temperaturas que son lo suficientemente suaves como para sostener la vida y los procesos vitales. Los espectrales se clasifican de O, B, A, F, G, K a M.O es el espectral más caliente y M es el más frío. El espectro caliente definitivamente no puede soportar la vida debido a las temperaturas. G es lo suficientemente luminoso y tiene un rango de temperatura adecuado que puede soportar la vida. Aunque se ha dicho que F y K sustentan la vida en estudios recientes, la credibilidad de este estudio queda por afirmar que el espectro que está iluminado por el sol es el único espectral que se ha confirmado que sustenta la vida. La tierra cae bajo este espectro y esto es una confirmación de que en realidad sustenta la vida. Hay un equilibrio de gases, compuestos y energía en el espectro G y esto es realmente lo que sustenta la vida y el crecimiento.