Los biólogos y los químicos tienen un nuevo lenguaje de programación que puede detectar contaminantes ambientales previamente desconocidos a un ritmo sorprendente, sin que codifican. Al facilitar la búsqueda de grandes cantidades de conjuntos de datos químicos, la herramienta ha identificado compuestos tóxicos ocultos a la vista plana.
Los datos de espectrometría de masas son como una huella digital química que muestra a los científicos las moléculas en la muestra, como el aire, el agua o la sangre, y cuánto. Ayuda a identificar todo, desde contaminantes en agua hasta productos químicos para nuevas drogas.
Las características desarrolladas en UC Riverside, el lenguaje de consulta de masas o los datos de espectrometría de masas de los motores de búsqueda permiten a los investigadores encontrar patrones que requieren habilidades de programación avanzadas. Detalles técnicos sobre el lenguaje y un ejemplo de cómo puede ayudar a identificar productos químicos retardantes de llama en vías fluviales públicas Método natural Artículos de revistas.
“Queremos dar a los químicos y biólogos que generalmente no son científicos informáticos, que pueden extraer con precisión sus datos sin tener que pasar meses o años codificando”, dijo Mingxun Wang, profesor asistente de informática en UCR, quien creó el idioma.
Mientras demuestra la efectividad del idioma, Nina Zhao, una estudiante postdoctoral de la UCR en San Diego, utilizó MassQL para detectar datos de espectrometría de masas en todo el mundo, introduciendo muestras de agua que ya podrían proporcionarse al público. Ella está buscando organofosfatos, generalmente que se encuentran en los retardantes de la llama.
“Literalmente, hay mediciones de mil millones de moléculas en estos datos. No se puede navegar por ellos manualmente”, dijo Wang. “Pero para estos productos químicos, el lenguaje es como un filtro, y saca miles de ellos”.
Además de encontrar productos químicos conocidos en muestras de agua, también encontraron compuestos organofosforados que no se han descrito o clasificado anteriormente, así como algunos productos químicos que algunos de los productos de organofosforados se han descompuesto con el tiempo.
“Estos productos químicos pueden causar muchos problemas para la salud de los humanos y los animales, así como para todo el ecosistema”, dijo Zhao. “Están diseñados como retardantes o plastificantes de llama, pero pueden causar interrupciones endocrinas y sexuales del sistema y problemas cardiovasculares”.
Antes de que se puedan hacer los planes o eliminar productos químicos tóxicos de nuestro entorno, los científicos necesitan saber qué hay allí. Así es como MassQL es conveniente para científicos como Zhao.
“El lenguaje me permite rastrear todo lo que encuentro en todos los datos en el aire, el suelo, el agua e incluso el cuerpo humano. No importa lo que exista, podemos buscar productos químicos en él”.
Uno de los desafíos para crear MassQL es lograr que los científicos de la vida acuerden la definición de términos utilizados por el software. “Tanto los químicos como los informáticos tienen que entenderlo, y el software debe ser capaz de operar en él”, dijo Wang.
Como resultado, unos 70 científicos consultaron durante la fase de desarrollo. Todos expresan comentarios sobre los términos de información más importantes y cómo expresar comentarios en el lenguaje MassQL.
El equipo de investigación también quería demostrar que el lenguaje podría ser útil en varias vidas de la vida real. Además del proyecto de Zhao, este artículo también presenta más de 30 aplicaciones que pueden aplicar MASSQL en detalle.
Los casos de uso de la muestra incluyen encontrar ácidos grasos como un sello distintivo del alcoholismo, encontrar nuevas drogas para abordar la inminente crisis de resistencia a los antibióticos, comprender las bacterias químicas que usan para comunicarse entre sí y encontrar productos químicos eternos en el patio de recreo.
En el pasado, Wang recibió solicitudes de software que podían encontrar patrones de datos específicos para todos estos diferentes tipos de aplicaciones.
“Creo que puedo hacer algunos ahorros de tiempo”, dijo. “Quiero crear un idioma que pueda manejar múltiples consultas. Ahora lo tenemos. Estoy feliz de escuchar sobre el descubrimiento que podría provenir de esto”.