news-07112024-154532

El modelo de inteligencia artificial Claude 3.5 Sonnet de Anthropic ha mejorado sus capacidades para analizar archivos PDF, enfocándose tanto en el texto como en elementos visuales complejos, como gráficos y tablas.

Anteriormente, Claude.ai solo extraía texto de los archivos PDF para su análisis, pero ahora con la nueva versión, es capaz de visualizar los PDF con precisión junto con el texto. Esta función avanzada está disponible en la versión de prueba de la función de chat de Claude y en el acceso a la API, con planes futuros de compatibilidad con Google Vertex AI y Amazon Bedrock.

Además, Claude 3.5 Sonnet AI puede analizar documentos legales, informes financieros y realizar traducciones, integrando texto, imágenes, tablas y gráficos en su análisis. Esta funcionalidad de PDF se puede combinar con otras características del modelo para un análisis completo.

Para utilizar estas nuevas funciones de manera óptima, el sistema de análisis de PDF procesa archivos de hasta 32 MB y 100 páginas, utilizando entre 1,500 y 3,000 tokens por página. Es importante tener en cuenta que el modelo no admite archivos protegidos con contraseña o cifrados.

Anthropic recomienda utilizar documentos con texto legible y páginas correctamente alineadas para obtener mejores resultados. En el caso de analizar secciones específicas de un documento, se aconseja indicar los números de página. Para documentos extensos, se sugiere dividirlos en secciones más pequeñas y aplicar la técnica de «caching» de prompts para mejorar la eficiencia del análisis.

Claude 3.5 Sonnet fue lanzado en junio de este año y ha sido mejorado en el último mes. Según pruebas de rendimiento disponibles, este modelo ha superado a otros modelos en comprensión del lenguaje natural, como Meta Llama 400b, GPT-4o de OpenAI y Gemini 1.5 Pro de Google.

En resumen, la actualización de Claude 3.5 Sonnet de Anthropic ofrece una mejora significativa en el análisis de archivos PDF, permitiendo una visualización precisa de elementos visuales complejos y una integración completa de texto e imágenes en el análisis de documentos.