20240408 每日AI必读资讯

人工智能

📚 第一个具有情商的对话型AI来了!AI下一个重大飞跃是理解情感
- HumeAI发布具有情感识别能力的对话AI,能检测53种情绪。
- HumeAI致力于理解和回应用户情感,通过声音特征实现互动。
- 提供API让用户训练自己的AI模型,应用广泛覆盖健康、客服等领域。
🔗官网地址:https://dev.hume.ai/docs/expression-measurement-api/overview

🎥 Lixel CyberColor:自动生成无限大的电影级效果的3D场景
- LCC采用Multi-SLAM和高斯溅射技术生成电影级效果的3D场景。
- XGRIDS的Multi-SLAM算法和3DGS技术创造逼真大型3D模型。
- XGRIDS提供LCC插件和SDK支持在多平台上无限复制3D内容。
🔗官网地址: https://xgrids.com/lcc
🔗 https://blink.csdn.net/details/1676446

🤖 OpenAI 转录了超过一百万小时的 YouTube 视频来训练 GPT-4!
- OpenAI使用YouTube视频转录训练GPT-4。
- AI公司遇到高质量训练数据挑战。
- 公司处理数据问题涉及版权法模糊区域。
🔗 https://blink.csdn.net/details/1676441

💼Twitter-web-exporter:一键导出推文、书签、列表
- 可以直接从推特的网页版应用中导出推文、书签、关注列表等多种数据。
- 无需开发者账号和使用API密钥。
- 支持导出为 JSON、CSV 和 HTML。
🔗 https://github.com/prinsss/twitter-web-exporter
🔗 https://blink.csdn.net/details/1676450

🌐DeepMind发布Gecko: 专注于文档检索 性能媲美大7倍模型​​​​​​​
- Gecko是通用文本嵌入模型,专注于文档检索、语义相似度和分类任务。
- Gecko通过从LLM中提炼知识,融入检索器,实现强大检索性能。
- 在大规模文本嵌入基准上,256维Gecko优于768维现有模型。
🔗论文地址: https://arxiv.org/pdf/2403.20327.pdf

图片

🎨AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!
- MiniGPT4-Video框架能理解复杂视频,还能创作诗歌配文。
- 支持处理时态视觉数据和文本数据,善于理解视频的复杂性。
- 在多个基准测试中,MiniGPT4-Video有显着提高,可为视频配文、广告等提供强大解读能力。
🔗论文: https://arxiv.org/pdf/2404.03413.pdf

图片

微信扫码立即使用「源自下载」小程序

「源自下载」小程序二维码

Copyright © 2019-2024 源自下载