Datos no estructurados: un obstáculo para adoptar la tecnología de inteligencia artificial
HogarHogar > Blog > Datos no estructurados: un obstáculo para adoptar la tecnología de inteligencia artificial

Datos no estructurados: un obstáculo para adoptar la tecnología de inteligencia artificial

Jul 12, 2023

Kaushik es arquitecto técnico y consultor de software, con más de 20 años de experiencia en la industria de análisis, desarrollo, arquitectura, diseño, pruebas y capacitación de software. Él…

Eddie Wrenn es un reportero y editor de noticias que ha trabajado en redacciones nacionales e internacionales en todo el Reino Unido y Australia, centrándose en...

La inteligencia artificial ya está demostrando su valía en tareas como el análisis de tendencias y el apoyo al diagnóstico médico. Sin embargo, su eficacia depende de los datos estructurados, lo que puede ser una debilidad debido a la escasez de datos. La dependencia de la IA de datos estructurados plantea obstáculos cuando se enfrenta a datos no estructurados o difíciles de analizar, lo que limita sus capacidades. Es alentador que se estén realizando esfuerzos para mejorar la capacidad de la IA para manejar datos no estructurados.

La inteligencia artificial (IA) es capaz de hacer cosas que antes eran inimaginables.

Puede distinguir entre un peatón y una señal de tráfico para guiar un automóvil autónomo, revisar el tono de un artículo y proporcionar comentarios, proporcionar datos útiles del paciente a un médico y realizar mil otras tareas reflexivas y que ahorran tiempo.

Sin embargo, para hacer lo que hace, la IA a menudo depende de datos estructurados, y esa dependencia puede convertirse en su talón de Aquiles.

La IA puede manejar todo tipo de datos de diversas fuentes, estructurados o no estructurados. Ejemplos incluyen:

Los sistemas de IA necesitan un formato de datos consistente, al menos para tareas a gran escala, pero aplicar uniformidad es un desafío cuando los datos de diferentes fuentes son obstinadamente variados y difíciles de encajar en una estructura.

Para darle forma a los datos, el proceso de preprocesamiento (como eliminar errores, espacios no deseados y valores atípicos) es un proceso que requiere mucho tiempo.

Los datos también pueden venir en varios formatos, ingresados ​​mediante API, archivos JSON u hojas de cálculo, y con el tiempo surgen nuevos formatos de datos que pueden complicar aún más el problema.

La confidencialidad de los datos también puede aumentar la complejidad, y los proveedores deben ser extremadamente cautelosos para evitar fugas de datos.

Utilicemos la IA y las imágenes médicas para comprender cómo los datos no estructurados obstaculizan la adopción de la IA, utilizando rayos X, tomografías computarizadas y resonancias magnéticas como casos de prueba.

Idealmente, la IA debería analizar los informes de imágenes y permitir a los radiólogos y médicos diagnosticar la enfermedad con precisión y rapidez. Sin embargo, los siguientes factores limitan gravemente la capacidad de la IA para interpretar correctamente los resultados de las imágenes:

La variabilidad en términos de calidad, ángulo, iluminación y posicionamiento del paciente dificulta que la IA comprenda las imágenes, lo que puede generar errores o resultados erróneos.

La variabilidad en términos de anatomías de diferentes pacientes es un desafío de comprensión para los sistemas de IA. A la IA le encanta la uniformidad y todavía está aceptando la diversidad en la anatomía humana.

Las anotaciones permiten a la IA comprender mejor las imágenes, y la falta de ellas hace que la IA descifre las placas de imágenes por sí sola, lo cual, sin ningún recurso útil, es un desafío.

La IA requiere uniformidad y coherencia de los datos, pero las imágenes de afecciones médicas poco comunes o raras limitan gravemente su capacidad para procesar los datos. Comprender tales condiciones requiere que los sistemas de inteligencia artificial aprendan sobre la marcha.

Las imágenes pueden contener ruido, artefactos y distorsiones debido a diversos factores, como problemas de la máquina, incumplimiento de los protocolos de imágenes o cambios en las posiciones del cuerpo del paciente. Los datos no estructurados son el resultado de tales problemas y dificultan la comprensión por parte de la IA.

La IA tiene un largo camino por recorrer para resolver múltiples casos de uso debido a la dependencia de datos estructurados. Mientras tanto, para las organizaciones, proporcionar datos estructurados sigue siendo una tarea costosa y que requiere mucho tiempo.

Es necesario mejorar el aprovisionamiento y el análisis de datos para desbloquear todo el potencial de la IA y, al mismo tiempo, es necesario trabajar mucho para equipar los sistemas de IA para manejar datos no estructurados.

Kaushik es arquitecto técnico y consultor de software, con más de 23 años de experiencia en la industria de análisis, desarrollo, arquitectura, diseño, pruebas y capacitación de software. Tiene interés en nuevas áreas de tecnología e innovación. Se centra en arquitectura web, tecnologías web, Java/J2EE, código abierto, WebRTC, big data y tecnologías semánticas. Ha demostrado su experiencia en análisis de requisitos, diseño e implementación de arquitectura, preparación de casos de uso técnico y desarrollo de software. Su experiencia ha abarcado diferentes ámbitos como seguros, banca, aerolíneas, envíos, gestión documental y desarrollo de productos, etc. Ha trabajado con una amplia variedad de tecnologías desde mainframe (IBM S/390),…

¿Qué es un ataque de Sybil? Un ataque Sybil es un tipo de amenaza de ciberseguridad en la que un adversario crea y...

Margaret RouseExperto en Tecnología

NAS y SAN: la N en ambos acrónimos palindrómicos significa red. Están estrechamente relacionados en ese SAN...

Marshall GunnellEscritor de tecnología

Kaushik PalEddie WrennVariabilidad de imágenesvariación anatómicaFalta de anotacionesCasos raros o poco comunesRuido y artefactosProceso editorial de Techinfo explicado