Contacta con nosotros

¿Sabías que?

La minería de datos provoca una rebelión en Europa

Publicado

el

Minería de Datos

A mediados de 2013 bibliotecarios, científicos y empresas plantaron a la Comisión Europea (CE) en una reunión que pretendía abrir nuevos caminos en el uso de la minería de datos para la información científica./ Anroir.

Ni en toda una vida mucha gente podría leer todos los libros de su ebook. Menos aún sacar conclusiones de todas esas lecturas y crear nueva información. Lo mismo pasa en el ámbito científico, pero para eso se ha creado la minería de datos que permite a las máquinas leer y gestionar de forma masiva artículos o información web. En Europa se ha topado con una ley de propiedad intelectual poco flexible que produce una situación irónica: un investigador en EE UU puede explotar información de textos europeos con esta técnica, sin embargo los científicos desde el viejo continente lo tienen difícil.

AGENCIA: SINC

A mediados de 2013 bibliotecarios, científicos y empresas plantaron a la Comisión Europea (CE) en una reunión que pretendía abrir nuevos caminos en el uso de la minería de datos para la información científica. Este desplante se produjo porque entendieron que, sin una directiva de copyright que facilite el uso de esta técnica computacional en un contexto científico, no se va a ningún lado.

El problema reside en que para hacer minería de datos (TDM, por sus siglas en inglés), antes hay que copiar documentos científicos para después aprovechar su información. Las leyes de copyright de la CE no permiten hacer estas copias a no ser que se disponga de un permiso especial. La reunión de la CE pretendía establecer las condiciones de esas licencias para permitir la minería de datos.

La ciencia avanza a través del intercambio de datos, información y conocimientos. La tesis de la minería de datos se basa en que si enseñamos a las máquinas a leer y establecer relaciones, se puede explotar la información de forma mucho más eficaz. Esta técnica ya se utiliza, por ejemplo, en webs que comparan precios de hoteles o billetes de avión. Ahora podrá ayudar a los científicos a descifrar procesos que requieren la lectura de muchísimos artículos científicos.

“Al aplicarla en información académica, se pueden extraer datos de un montón de fuentes y establecer relaciones entre ellas. Esto permite hacer hallazgos que para un humano o son imposibles de establecer o le llevarían toda una vida”, explica a SINC Izaskun Lacunza, directora ejecutiva de la Liga de Bibliotecas Europeas de Investigación (LIBER), institución que lidera la rebelión.

A pesar de su complejidad, una minería de datos eficaz supondría establecer una velocidad de crucero en los avances científicos si no existieran las actuales restricciones.

“Decidimos abandonar el grupo de trabajo porque entendimos que la Comisión tenía unas miras muy cortas para una técnica que creemos que puede suponer una revolución científica y que merece una excepción a la ley de copyright. Se debe tomar una decisión al respecto de forma urgente. El derecho a leer material al que legalmente se tiene acceso debe incluir el derecho a hacer minería de datos. El copyright protege la expresión de las ideas, no los hechos y los datos que incluye la obra. La minería de datos extrae hechos y datos y genera nuevo conocimiento, en ningún caso sustituye o copia la obra original”, añade Lacunza.

En junio, revistas como Nature se hicieron eco de este polémico proceso que continúa abierto.

Desde LIBER piden que se haga una excepción que posibilite a científicos y empresas explotar la ingente cantidad de textos científicos. Según la experta, esta reforma supondría ganar en competitividad ante países como EE UU o Taiwán, que ya están haciendo minería de datos en ciencia con mayor protección legal que en Europa.

Asimismo, permitirá a los expertos rastrear entre los millones de artículos científicos información sobre sus líneas de investigación, para extraer datos o para seleccionar patrones como, por ejemplo, asociaciones entre genes y enfermedades.

Recogida de firmas y reacción de la Comisión

Tras salir del grupo, LIBER lideró una petición que han firmado universidades, agencias de investigación, científicos, asociaciones de medianas y pequeñas empresas, etc., pidiendo a la CE una nueva directiva.

La intención de la Comisión en principio era volver a licenciar la información, es decir, que se volviera a pagar a los editores de las revistas para poder hacer TDM –además de la convencional suscripción por leer–.

Fuentes de la CE consultadas por SINC aseguran que están evaluando la situación. “Sin embargo en el contexto de la revisión en curso de los derechos de autor, a nuestro entender, muy pocos países en el mundo tienen una excepción TDM específica en su legislación. Japón es uno de ellos”, afirman.

En este camino hacia el entendimiento, la Comisión Europea lanzaba en diciembre una consulta pública sobre dichas normas de derecho de autor en la UE, que incluía preguntas sobre cómo gestionar correctamente y de forma legal la TDM.

Por su parte, los firmantes de la carta enviada a la Comisión, entre los que se encuentra la Liga de Universidades de Investigación Europea (LERU) y el Consejo Superior de Investigaciones Científicas (CSIC), así como prácticamente todos los homólogos europeos de este último, creen que el derecho a leer es el derecho a hacer minería de datos, siempre que no vulnere la propiedad intelectual.

“Lo contrario creemos que es bloquear información que no ha lugar. La técnica en sí misma no fusila los textos, sino que establece relaciones. Es como un superlector. El hecho de que haya que hacer una copia es circunstancial”, añade Lakunza. Sin embargo, la incertidumbre legal es muy seria.

La gran paradoja: en EE UU sí, desde Europa no

“La gran cantidad de actividades de minería de datos que tienen lugar hoy en día se llevan a cabo ya sea bajo una licencia o sin la necesidad de ninguna autorización (o cualquier excepción) en los textos que están libremente disponibles en Internet”, argumenta la CE.

Pero la realidad es que los investigadores no saben qué hacer con el tema. Además, en EE UU existe una excepción a la ley de propiedad intelectual, el denominado fair use, es decir, un uso justo que permite determinadas explotaciones de la información siempre y cuando cumplas determinadas premisas.

Aquí surge la gran paradoja: Europa protege su contenido para hacer TDM, pero si el científico que quiere explotar los datos está localizado en EE UU sí puede utilizar esa información europea.

Por ello, algunas pequeñas y medianas empresas que se están arriesgando a hacer TDM sin protección legal, se plantean incluso irse a EE UU si las cosas se ponen feas.

En el Reino Unido ha habido un progreso hacia la introducción de una excepción al derecho de autor en TDM para fines no comerciales, lo que ha dado lugar a una propuesta de su Oficina de Propiedad Intelectual para un proyecto de ley en la materia, que ahora está bajo consideración.

La única institución en Europa dedicada íntegramente a la minería de datos es el Centro Nacional de Minería de Datos de la Universidad de Manchester (Reino Unido), que también firma la petición a la CE. Su subdirector, John McNaught, aboga incluso por su uso en el sector privado: “Si una compañía farmacéutica tenía acceso legal a obras con derecho de autor, ¿por qué no se les permite utilizar los resultados con el fin de, por ejemplo, producir un nuevo medicamento para salvar vidas? También están interesados en la minería de datos para uso comercial”.

Ahorro y crecimiento económico exponencial para la UE

En el Centro Nacional de Minería de Datos de la Universidad de Manchester utilizan dos técnicas para mejorar la eficiencia de los análisis. Han creado la herramienta NaCTeM, que presta servicios de minería de texto semántica a Europa PubMed Central, una fuente de información gratuita para los investigadores biomédicos y sanitarios. Esta institución ofrece acceso a unos 2,6 millones de artículos de texto, aunque solo alrededor de 570.000 son de libre acceso.

Emplean también la computación en nube, que permite distribuir múltiples tareas para procesar grandes colecciones e indexar los resultados.

“Hasta ahora hemos analizado alrededor de 81 millones de frases para producir un servicio llamado EvidenceFinder que genera preguntas sobre un tema, de forma automática, a partir de las cuestiones que un usuario ha reiterado de forma sucesiva”, explica el subdirector del centro.

Según los especialistas, Europa tiene el potencial de ser no solo competitivo, sino líder en TDM en el mundo. Un estudio en Reino Unido, encargado por el Consejo de Financiación de Educación Superior, demuestra el alto impacto económico, y el valor y los altos beneficios que la minería de datos proporcionaría a Europa si se aplicara la excepción a la ley.

“La evidencias reunidas en el informe muestran que existe un claro potencial en la minería para generar ganancias significativas en productividad, con beneficios tanto para el negocio del propio sector como para la economía en general. Una generalización de la TDM por parte de los científicos supondría una gran oportunidad para el Reino Unido, fomentando la innovación y el crecimiento a través de un valor adicional de la investigación pública”, dice el informe.

En este trabajo también se muestra la preocupación por las limitaciones actuales de la ley. “Hay un nuevo enigma: la intervención en el mercado de los derechos de autor –originalmente con intención de proteger la propiedad artística de los productores– que se está convirtiendo en sí mismo en una barrera para la nueva producción creativa y puede frenar nuevos descubrimientos para el conocimiento y la innovación”, lamentan.

La flexibilidad en la norma podría suponer el principio del fin de un negocio que los editores quieren proteger. Izaskun Lacunza, de LIBER, lo explica así: “Imagina que la TDM explota y comienza a ser una técnica muy utilizada por los investigadores, que generen ciencia basada en los datos que existen actualmente. Es lo que creemos que va a pasar. Pero para los editores la información es fuente de ingresos. Su pretensión es volver a licenciar el contenido a aquellas instituciones que quieran hacer minería de datos, aunque ya estén pagando por el acceso a esa información para sus investigadores”.

[box style=»4″]

Nuevas profesiones con escasez de especialistas

John McNaught, subdirector del Centro Nacional de Minería de Datos de la Universidad de Manchester, subraya la importancia de formar nuevos profesionales que trabajen en esta revolucionaria disciplina. “La minería de datos depende de técnicas de procesamiento de lenguaje natural y, por lo tanto, de la tecnología del lenguaje. Hay una gran carencia de especialistas en estas dos áreas fundamentales”.

Un estudio realizado en 2011 encontró que tan solo en los EE UU hacían falta entre 140.000 y 190.000 profesionales con las habilidades necesarias hacer minería de datos.

La Alianza Europea de Tecnología Multilingüe (META-NET) concluyó que la falta de personal calificado en la actualidad es uno de los principales cuellos de botella para empresas y centros de investigación.

[/box]

Continuar leyendo
Publicidad
Clic para comentar

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia

Se descubre cómo escribir con átomos todos los libros del mundo en un soporte de cobre del tamaño de un sello

Publicado

el

Por

Fragmento de la conferencia There’s Plenty of Room at the Bottom de Richard Feynman escrita mediante átomos de cloro. / TU Delft

Fragmento de la conferencia There’s Plenty of Room at the Bottom de Richard Feynman escrita mediante átomos de cloro. / TU Delft

Un bit de información se puede registrar por la posición de un solo átomo de cloro en una superficie metálica, y de esta forma se podrían crear dispositivos de almacenamiento de datos del tamaño de un sello con el contenido de todos los libros de la humanidad. El avance lo acaban de demostrar investigadores de la Universidad de Delf (Países Bajos) con la colaboración de un científico español.

En 1959, el físico estadounidense Richard Feynman pronunció su famosa conferencia There’s plenty of room at the bottom (Hay mucho sitio al fondo) donde planteó que si tuviéramos una plataforma en la que se pudieran organizar los átomos individuales en un patrón ordenado, sería posible almacenar una pieza de información en un átomo.

Ahora su sueño se ha hecho realidad. Un equipo de científicos del Instituto Kavli de Nanociencia de la Universidad de Delft (Países Bajos) ha logrado construir una memoria de 1 kilobyte (8.000 bits), donde cada bit está representado por la posición de un solo átomo de cloro sobre una superficie de cobre.

Además, en honor al visionario Feynman, los investigadores han codificado unos párrafos de la conferencia de Feynman en un espacio de 100 nanómetros de ancho. Para ello han utilizado un microscopio de efecto túnel (STM), cuya punta es capaz observar los átomos y moverlos de uno a uno al lugar deseado.

«Se podría comparar a un puzzle», explica Sander Otte, el científico que lidera la investigación, publicada esta semana en Nature Nanotechnology. «Cada bit consiste en dos posiciones sobre la superficie de átomos de cobre, de tal forma que un átomo de cloro se puede deslizar hacia atrás y adelante entre estas dos posiciones”.

“Si el átomo de cloro está en la posición superior, hay un agujero debajo de ella, y correspondería a un bit 1 –añade el experto–. Si el orificio está en la posición superior y, por tanto, el átomo de cloro está en la parte inferior, entonces el bit es un 0».

Como los átomos de cloro están rodeados por otros átomos del mismo elemento, excepto cerca de los agujeros, se mantienen en su lugar. Por este motivo el método de los huecos es mucho más estable que otros anteriores con átomos sueltos, además de ser más adecuado para el almacenamiento de datos, según los autores.

Cada día se generan más de mil millones de gigabytes de nuevos datos en nuestra sociedad tecnológica, y para almacenar tanta información cada vez es más importante que cada bit ocupe el menor espacio posible. Los científicos del Instituto Kavli han logrado llevar esa reducción al límite: construir una memoria de 1 kilobyte (8.000 bits), donde cada bit está representado por la posición de un solo átomo de cloro.

«En teoría, esta densidad de almacenamiento permitiría que todos los libros que ha sido creados por la humanidad pudieran ser escritos en un solo sello de correos», destaca Otte.

En concreto, los científicos llegaron a una densidad de almacenamiento de 500 terabits por pulgada cuadrada (Tbpsi), 500 veces mayor que la del mejor disco duro comercial disponible actualmente.

Una de las limitaciones del dispositivo es que opera a temperaturas muy bajas, pero también mejora lo conseguido hasta ahora. Hoy se necesitan temperaturas en el rango del helio liquido (4 grados kelvin) para configuraciones estables, y la modificación de la posición de un solo átomo requiere la regeneración de toda la superficie de trabajo.

Sin embargo, Otte y sus colegas, entre los que figura el español Joaquín Fernández Rossier, han logrado preservar las posiciones de más de 8.000 vacantes de cloro (donde faltan átomos) durante más de 40 horas a 77 grados Kelvin. Al definir un alfabeto binario basado en posiciones de vacantes o puestos libres, se pueden almacenar sobre la superficie diferentes textos, como el fragmento de la conferencia de Feynman, y luego modificarlo a voluntad bit a bit.

La velocidad del proceso de escritura y lectura todavía es lenta (varios minutos) en este dispositivo, que tendrá que ser optimizado antes de poderlo aplicar en la tecnología cotidiana, pero estos resultados demuestran que se pueden crear memorias de almacenamiento de datos que superen en gran medida a los discos duros actuales.

FUENTE: SINC

Referencia bibliográfica:

[box style=»2″]

Sander Otte et al.”A kilobyte rewritable atomic memory”. Nature Nanotechnology, julio de 2016.

[/box]

Video en inglés:

Continuar leyendo

Ciencia

Con ‘amor’ la evolución funciona mejor

Publicado

el

Por

Los científicos alemanes realizaron una sesión de speed-dating (citas rápidas) con una población de 160 pinzones cebra (Taeniopygia guttata). / EOL

Los científicos alemanes realizaron una sesión de speed-dating (citas rápidas) con una población de 160 pinzones cebra (Taeniopygia guttata). / EOL

La búsqueda de pareja por parte de los humanos, muchas veces frustrada por las limitaciones que nosotros mismos nos creamos, tiene sus costes y sus beneficios si se tiene en cuenta el resultado biológico final: tener hijos. Un experimento con pájaros demuestra que cuanto más ‘amor’ existe en la pareja, más probabilidades existen de que la descendencia sobreviva.

Los humanos somos extremadamente exigentes a la hora de encontrar pareja, sentar cabeza y tener hijos. Todo esto ocurre después de un proceso que incluye flirteos, salir con los amigos, acceder a webs de contactos, tener citas embarazosas, ser rechazado o retirarse a tiempo. Pero al final llega la buena suerte, nos enamoramos y vivimos felices.

Sin embargo, el proceso para encontrar pareja podría ir en contra de la propia evolución, cuya meta final es el apareamiento. El amor puede llegar a ser un negocio con beneficios pero también con ciertos costes con muchas frustraciones y limitaciones éticas en el caso de los humanos. Pero, ¿qué consecuencias evolutivas tiene la búsqueda de pareja?

Para responder a esta pregunta, un equipo de científicos alemanes realizó una sesión de speed-dating (citas rápidas) con una población de 160 pájaros llamados diamantes mandarín o pinzones cebra (Taeniopygia guttata), elegidos por compartir muchas características sociales con los humanos como la monogamia y la carga parental.

“En estas aves, las relaciones extraconyugales son más comunes en parejas que fueron asignadas. Con el tiempo el nivel de promiscuidad aumenta en los machos mientras que disminuye en las hembras. Esto también parece ser la tendencia en humanos”, explica a Sinc Malika Ihle, coautora del estudio publicado en PLoS Biology e investigadora en el Instituto Max Planck de Ornitología (Alemania).

Otra característica es que las hembras de pinzón cebra eligen a sus parejas de manera individual, es decir que no existe un consenso entre las hembras para determinar el macho más atractivo. Los investigadores dejaron grupos de 20 hembras elegir entre 20 machos. Una vez que se formaron parejas, el equipo dejó que la mitad de ellas viviera tranquilamente mientras que a la otra mitad les obligó a separarse y juntarse con otros individuos con el ‘corazón partido’.

Más pollos cuando hay ‘amor’

Una vez que se formaron todas las parejas (las felices y las de ‘conveniencia’), los científicos las dejaron criar en pajareras para evaluar sus comportamientos y medir los embriones y pollos muertos, así como los que sobrevivieron.

“Los resultados demuestran que las parejas que se eligieron libremente tuvieron pollos que sobrevivieron un 37% más que las que se formaron al azar y que por tanto tuvieron menor compatibilidad”, asegura Ihle. A esto se suma el hecho de que los nidos de las parejas que no se eligieron tuvieron tres veces más huevos no fertilizados que las parejas ‘felices’, un mayor número de huevos se ocultó o perdió, y muchos más pollos murieron al poco de nacer.

“La mayor parte de las muertes se produjo a las 48 horas, un periodo crítico para los padres, encargados del cuidado. En este sentido, los padres de las parejas que no tuvieron verdadera opción de elegir pareja fueron mucho menos cuidadosos con las tareas del nido”, indican los autores.

Los científicos observaron además que los machos de las parejas de ‘conveniencia’ prestaron la misma atención a sus parejas que los machos de las parejas felices. Sin embargo, las hembras fueron mucho menos receptivas y copularon mucho menos frecuentemente. Por tanto, estas parejas fueron menos atentas el uno hacia el otro y se produjo mayor infidelidad.

“El estudio permite entender cómo se produce la elección de pareja, qué consecuencias evolutivas tiene esta selección, y cómo se mantienen (de generación en generación) las preferencias de elección. Pero también es interesante para saber qué es realmente el amor”, declara a Sinc la experta.

FUENTE: SINC

[box style=»2″]

Referencia bibliográfica:

Malika Ihle et al. «Fitness Benefits of Mate Choice for Compatibility in a Socially Monogamous Species» PLOS Biology 14 de septiembre de 2015

[/box]

Continuar leyendo

Ciencia

La Nasa encuentra al primo mayor de la Tierra

Publicado

el

Por

NASA/Ames/JPL-Caltech/T. Pyle

NASA/Ames/JPL-Caltech/T. Pyle

Las observaciones del telescopio espacial Kepler de la NASA han permitido detectar al primer planeta de un tamaño similar al de la Tierra orbitando en la zona habitable de una estrella parecida al Sol. Esta zona es la región alrededor de una estrella donde las temperaturas son las adecuadas para que el agua –un ingrediente esencial para la vida– exista en forma líquida.

El exoplaneta ha sido bautizado como Kepler-452b y se encuentra en la constelación de Cygnus, el Cisne, a unos 1.400 años luz de distancia. En esta ilustración se representa su posible apariencia, aunque los científicos todavía no saben si el planeta tiene océanos y continentes.

La NASA considera a Kepler-452b como “un primo más viejo y grande” que la Tierra, ya que es un 60% mayor que el nuestro. Orbita cada 385 días a su estrella, también de tipo espectral G2 como el Sol y con una temperatura y masa similares. Esa lejana estrella tiene unos 6.000 millones de años, unos 1.500 millones años más que la nuestra.

FUENTE: SINC

Continuar leyendo
Publicidad

Trending

Uso de cookies

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies