您的位置：首页 > 新闻 > 高新技术 > 新闻详情

英伟达ChatRTX迎0.3版本更新新增照片搜索、AI语音识别等功能

时间：2024-05-02 21:09:48

来源：3DM整理
作者：skylark
编辑：豆角

英伟达今日宣布，旗下AI聊天机器人ChatRTX进行0.3版本更新，此次更新不仅增加了对谷歌的Gemma、ChatGLM3和OpenAI的CLIP等多种人工智能模型的支持，还首次集成了先进的Whisper语音识别系统，为用户带来前所未有的智能交互体验。

英伟达今年三月曾公开AI聊天机器人ChatRTX，使用者可以在有着英伟达RTX技术支援的Windows PC和工作站上，与储存在本地端的资料互动。ChatRTX利用检索增强生成、英伟达TensorRT-LLM软体与英伟达RTX加速等技术，将聊天机器人功能带至有着RTX技术支援的Windows PC和工作站上。在LLM的支援下，使用者可以透过ChatRTX查询他们的笔记和档案，且由于ChatRTX在使用者装置本机端运行，能够快速生成相关回应。

英伟达表示，最新版本加入支援其他LLM，包括由谷歌训练出最新的开放式、可在本地端运行的Gemma。Gemma是Google使用与自家Gemini模型相同的研究和技术，专为负责任AI开发而打造的模型。ChatRTX现在也支援基于通用语言模型框架的开放式中英双语ChatGLM3大型语言模型。

英伟达指出，由于支援OpenAI的对比语言和影像预训练技术，使用者能与影像资料进行互动。经过训练和细化后的CLIP神经网络，从自然语言监督中学习视觉概念。也就是说，这个模型会辨识在影像集里「看到」的东西。因ChatRTX支援CLIP，使用者可透过单字、术语和短语，与装置本机端的相片和影像进行互动，无需使用复杂的诠释资料标记。

另外，新版本的ChatRTX还让使用者可以用自己的声音与资料进行聊天。由于有支援使用AI处理口语的自动语音识别系统Whisper，使用者可以在应用程式上用语音进行查询，ChatRTX将以文字加以回应。这意味着用户不再局限于键盘输入，而是可以通过简单的语音指令来与机器人交互，查询本地数据，享受更为自然和高效的沟通方式。