mayo 14, 2024

ChatGPT aceptará comandos de voz y leerá imágenes;  saber más

ChatGPT aceptará comandos de voz y leerá imágenes; saber más

OpenAI anunció el pasado lunes (25) que ChatGPTA partir de ahora, su plataforma de IA proporcionará interacción mediante voz o imágenes. De esta forma, el chatbot podrá reconocer discursos en el texto.

La facilidad de uso será similar a la que ya encontramos hoy, realizada mediante mensajes de texto. Sin embargo, en lugar de escribir, el usuario puede hablar usando el botón de grabar para realizar la interacción. Con esto, el robot convertirá el discurso en texto y enviará lo solicitado.

Obtenga más información sobre cómo cambiar ChatGPT

(Imagen: freemovilms/freepic/reproducción)

La cuenta oficial de OpenAI en X/Twitter explica más sobre la nueva funcionalidad. Sin embargo, ha aclarado que esta nueva función sólo estará disponible para los usuarios suscritos al plan Plus.

La versión de mensajes de voz seguirá estando disponible para las aplicaciones. departamento de control interno que Androide. En cuanto a imágenes, para todas las plataformas. Puedes ver la publicación. aquí.

Para implementar dichos cambios, ChatGPT utiliza Whisper, una herramienta inteligencia artificial Que captura palabras habladas y las transcribe por escrito.

Por tanto, la plataforma también responderá a los usuarios mediante voz sintética. Pero, nuevamente, esta funcionalidad estará limitada a usuarios específicos.

¿Cómo funcionará la interpretación de imágenes?

En la misma barra de herramientas en la que escribimos será posible subir una imagen, la cual ChatGPT se encargará de intentar entender de qué quiere hablar el usuario y responder según su interpretación.

De esta manera, el trabajo es diferente a lo que ocurre hoy en día en lente de googleque realiza investigaciones en Internet.

ChatGPT ofrecerá una forma más natural, como si de una conversación se tratase. Sin embargo, OpenAI explica que la tecnología no reconocerá a las personas.

READ  Los Galaxy Buds FE tienen una gran cancelación de ruido sin costar una fortuna

Según la propia empresa, se trata de una medida que garantiza la seguridad y privacidad de todos los usuarios de esta tecnología.

Como dijimos anteriormente, ambas funciones estarán disponibles para los suscriptores de la plataforma, y ​​solo entonces se presentarán al público en general.