Distinguir las principales areas de aplicacion de la inteligencia artificial.
Modulo 01 - Microsoft Azure AI-901
Introduccion a los conceptos de inteligencia artificial
Panorama esencial para entender que puede hacer la IA y reconocer escenarios de examen.
Este modulo abre el curso con una vision no tecnica de la inteligencia artificial: capacidades, escenarios, limites y principios responsables. Esta preparado para estudiar de forma guiada, reforzar conceptos clave y practicar con una evaluacion corta.
Objetivos de aprendizaje
Lo que el estudiante debe poder explicar
Explicar como interactuan los usuarios con modelos generativos y agentes.
Reconocer casos de uso de NLP, voz, vision, extraccion de informacion e IA responsable.
Identificar pistas de examen asociadas a cada capacidad de Azure AI.
Vista de aprendizaje
Estudia por temas, no por archivos
La IA no es una unica tecnologia; es una familia de capacidades que se combinan para resolver problemas.
Como reconocerlo en examen
- Piensa en ejemplos cotidianos: chatbots, traduccion, reconocimiento facial, transcripcion y resumen de reuniones.
- Para AI-901 importa reconocer conceptos y escenarios; no necesitas programar modelos ni resolver matematicas.
- Cuando leas un caso, identifica tres cosas: que entra al sistema, que interpreta la IA y que salida produce.
Lectura rapida de cualquier escenario IA
Entrada
Texto, voz, imagen, video, documento o datos de negocio.Interpretacion
El modelo detecta patrones, significado, objetos o entidades.Salida
Prediccion, respuesta, resumen, accion recomendada o campo extraido.Detalles que vale la pena retener
No necesitas codigo para entender este modulo
El objetivo es reconocer capacidades y escenarios: que puede hacer la IA, que tipo de entrada necesita y que resultado entrega.
Lee cada caso como entrada -> interpretacion -> salida
Esa secuencia te ayuda a decidir si el escenario habla de texto, voz, vision, extraccion, generacion o responsabilidad.
Un agente combina lenguaje, reglas de comportamiento y herramientas para automatizar tareas de forma asistida.
Como reconocerlo en examen
- Diferencia generar contenido nuevo de recuperar informacion existente.
- Recuerda que el prompt es la instruccion o pregunta que guia la respuesta del modelo.
- Memoriza la estructura de un agente: modelo, instrucciones y herramientas.
Anatomia de un agente
Modelo
Comprende lenguaje, razona y genera respuestas.Instrucciones
Definen rol, limites, tono y comportamiento.Herramientas
Consultan conocimiento o ejecutan acciones externas.Detalles que vale la pena retener
IA generativa no solo responde: crea contenido nuevo
Puede generar dialogos, imagenes, video, codigo, documentos, resumenes o explicaciones a partir de una instruccion en lenguaje natural.
Modelos grandes y modelos pequenos
Los LLM se entrenan con mas datos y variables, generalizan mejor y suelen ser mas potentes. Los SLAM son mas pequenos, eficientes y utiles para temas concretos o ejecucion local en dispositivos.
Modelo, instrucciones y herramientas
El modelo razona, las instrucciones definen el rol y las herramientas le permiten consultar conocimiento o realizar acciones como enviar correos, actualizar calendarios o buscar datos.
Usos tipicos de IA generativa y agentes
Bots de chat, asistentes digitales, creacion de documentos, traduccion automatizada, resumen de contenido complejo y automatizacion de tareas.
IA generativa y agentes
NLP convierte texto sin estructura en informacion util para clasificar, resumir o tomar accion.
Como reconocerlo en examen
- Relaciona NLP con resenas, tickets de soporte, documentos legales, correos y transcripciones.
- Compara NLP especializado con IA generativa: el primero suele buscar resultados mas predecibles.
- Marca PII como tema de privacidad: nombres, telefonos, direcciones y otros datos personales.
Pipeline de analisis de texto
Detectar
Idioma, sentimiento, categoria o intencion.Extraer
Entidades, terminos clave y datos personales.Condensar
Resumen con los puntos principales del contenido.Detalles que vale la pena retener
NLP es la base del lenguaje en IA
El procesamiento de lenguaje natural permite que una solucion extraiga significado del texto y es una base importante para los modelos de lenguaje grandes.
Analisis de texto predecible
Deteccion de idioma, clasificacion, sentimiento, terminos clave, entidades, PII y resumen son tareas comunes cuando se necesita una salida mas controlada.
Donde aparece en la practica
Analisis de llamadas y reuniones, resenas de productos, redes sociales, bots de preguntas frecuentes y redaccion de informacion personal antes de compartir datos.
Texto y lenguaje natural
La voz permite que la IA participe en interfaces naturales, no solo en pantallas con texto.
Como reconocerlo en examen
- Separa mentalmente speech-to-text y text-to-speech; en el examen suelen confundirse.
- Asocia voz con retos reales: ruido de fondo, interrupciones, acentos y naturalidad.
- Recuerda el valor de accesibilidad: subtitulos, dictado, lectura en voz alta y traduccion.
Dos direcciones de voz
Speech-to-text
Audio hablado entra; texto transcrito sale.Text-to-speech
Texto entra; voz sintetizada sale.Detalles que vale la pena retener
Speech-to-text
La IA escucha una senal de audio y la transcribe a texto. Piensa en dictado, transcripcion de reuniones o comandos hablados.
Text-to-speech
La IA transforma texto en voz audible. Se usa en asistentes, lectura de contenido, accesibilidad y respuestas habladas.
Voz en aplicaciones y agentes
Agentes que reciben instrucciones habladas, transcripcion automatica, descripcion de audio, traduccion de voz y experiencias conversacionales.
Voz: escuchar y responder
Vision por ordenador permite que una aplicacion interprete contenido visual y lo convierta en datos accionables.
Como reconocerlo en examen
- Estudia la progresion: clasificar una imagen, ubicar objetos, segmentar pixeles y describir contenido.
- Relaciona Computer Vision con retail, seguridad, busqueda visual, inventario y vehiculos autonomos.
- Recuerda que muchos modelos visuales aprenden desde grandes conjuntos de imagenes etiquetadas.
Niveles de interpretacion visual
Clasificacion
Que contiene la imagen en general.Deteccion
Donde estan los objetos relevantes.Segmentacion
Que pixeles pertenecen a cada objeto.Multimodal
Descripcion visual enriquecida con lenguaje.Detalles que vale la pena retener
Que es la imagen
El modelo predice la etiqueta principal de una imagen. Es util cuando la pregunta busca identificar el asunto general.
Donde esta el objeto
La deteccion ubica objetos especificos dentro de una imagen, normalmente con regiones o cuadros alrededor.
Que pixeles pertenecen al objeto
La segmentacion semantica es mas fina que la deteccion porque identifica pixeles individuales asociados a una categoria u objeto.
Usos de Computer Vision
Busqueda visual, etiquetas automaticas, inventario en retail, video de seguridad, reconocimiento facial, robots y vehiculos autonomos.
Vision por ordenador
Extraer informacion significa convertir documentos o medios desordenados en campos que un sistema puede usar.
Como reconocerlo en examen
- Distingue leer texto con OCR de extraer campos utiles como proveedor, fecha, total e impuestos.
- Ubica OCR como base visual, pero recuerda que la extraccion agrega interpretacion de estructura.
- Asocia estos escenarios con procesos empresariales: gastos, archivo documental, busqueda e indexacion.
De documento a datos
Capturar
Imagen, PDF, recibo, formulario o grabacion.Reconocer
OCR localiza texto y estructura visible.Mapear
El modelo asigna valores a campos concretos.Usar
Los datos alimentan busqueda, archivo o procesos.Detalles que vale la pena retener
Primero localizar texto
OCR identifica texto dentro de imagenes o documentos escaneados. Es la base para que una solucion entienda recibos, formularios o documentos digitalizados.
Luego interpretar valores
La extraccion no se queda en leer texto: relaciona fragmentos con campos concretos, como fecha, proveedor, total o numero de serie.
Procesos donde brilla
Procesamiento de gastos, digitalizacion de formularios, indexacion documental, busqueda y extraccion de acciones desde reuniones o grabaciones.
Extraccion de informacion
Una solucion de IA tambien se evalua por sus riesgos, explicabilidad, seguridad y efectos en las personas.
Como reconocerlo en examen
- No reduzcas IA responsable a filtros de contenido; tambien incluye diseno, pruebas y gobernanza.
- Practica con casos de prestamos, admisiones, reconocimiento facial y automatizacion fisica.
- Recuerda que los sistemas probabilisticos necesitan monitoreo, limites y responsabilidad humana.
Principios que deben revisarse
Equidad
Reducir sesgos y resultados discriminatorios.Confiabilidad
Mitigar errores en sistemas probabilisticos.Privacidad
Proteger datos personales y organizacionales.Transparencia
Explicar funcionamiento, limites y uso de IA.Detalles que vale la pena retener
Los filtros de contenido son solo una parte
Mitigar contenido danino ayuda, pero IA responsable tambien exige diseno, pruebas, monitoreo, transparencia y gobernanza.
Los seis nombres que debes reconocer
Equidad, confiabilidad y seguridad, privacidad y seguridad, inclusion, transparencia y responsabilidad.
Como se ve en casos reales
Evaluar admisiones sin discriminacion, usar umbrales de confianza en robots, eliminar imagenes temporales, generar subtitulos y revelar el uso de IA en prestamos.
Banco de conceptos
Repaso rapido para no confundir capacidades
Modelo de lenguaje
Modelo entrenado con grandes volumenes de texto para comprender relaciones semanticas y generar respuestas coherentes.
Si la pregunta menciona prompts, dialogo o generacion de texto, piensa en IA generativa.
No es simplemente una base de datos: genera respuestas nuevas a partir de patrones aprendidos.
Agente de IA
Aplicacion que usa un modelo, instrucciones y herramientas para responder al contexto y automatizar acciones.
Modelo + instrucciones + herramientas es la formula clave.
No todo chatbot es agente; el agente puede usar herramientas para consultar o ejecutar acciones.
OCR
Reconocimiento optico de caracteres: identifica texto dentro de imagenes o documentos escaneados.
Recibos, formularios escaneados y extraccion de campos suelen apuntar a OCR o inteligencia documental.
OCR lee texto; la extraccion de informacion interpreta campos como fecha, proveedor o total.
Segmentacion semantica
Tecnica de vision que identifica pixeles pertenecientes a un objeto, no solo una caja alrededor de el.
Cuando la precision es por pixel, no basta deteccion de objetos.
No es clasificacion ni deteccion: trabaja a nivel de pixeles.
PII
Informacion de identificacion personal, como nombres, telefonos, direcciones o datos privados.
Redaccion, privacidad y cumplimiento suelen relacionarse con deteccion de PII.
No es una tecnica visual; suele aparecer en escenarios de texto, documentos y privacidad.
IA responsable
Practicas para construir IA justa, segura, privada, inclusiva, transparente y gobernada.
No es solo filtrar contenido: tambien incluye gobernanza y responsabilidad.
No se resuelve solo con moderacion; requiere diseno, pruebas, monitoreo y responsabilidad humana.
Evaluacion final