项目简介 VoiceCanvas 是一个先进的多语言语音合成平台,使用最新的 AI 技术提供高质量的文字转语音服务和语音克隆服务。 主要特点 多语言支持 支持超过 50+ 种语言 语音功能 多种语音服务集成: OpenAI TTS(高质量自然语音) AWS Polly(多语言支持) MiniMax(中文优化) 高质量语音合成 男声/女声选...
最近大家都被ChatGPT 4o吸引了,因为支持自然语言P图,尤其是支持图片换脸、把真实图片变成动漫等风格,大量已经停止续费的用户纷纷续费。 一夜之间,对AI绘画圈形成了降维打击。 不过,在开源AI绘画领域,这种事都不算事儿,因为总有高超的开发者会发布开源免费的平替工具。 在换脸方面,字节再次发布一个叫做InfiniteYou的开源插件,并且已经在comf...
机器之心发布 机器之心编辑部 刚刚,Local AI 领域的 Libra 团队发布了一段最新技术演示视频,展示了用户通过自然语言交互直接生成 Agent,并利用本地消费级算力支持 Agent 进行长程 (Long-Horizon) 推理,最终完成复杂任务。Libra 构建的本地化、即时响应、自我规划方案为行业开辟了一条全新的长程推理 Agent 技术路径,实...
新智元报道 编辑:KingHZ Aeneas 【新智元导读】在数学推理中,大语言模型存在根本性局限:在美国数学奥赛,顶级AI模型得分不足5%!来自ETH Zurich等机构的MathArena团队,一下子推翻了AI会做数学题这个神话。 3月26号,ETH等团队的一项研究一经发布,就引起了圈内热议。 这项研究彻底撕开遮羞布,直接击碎了「LLM会做数学...
在 AI 助手日益融入生活的今天,构建一个个人化、智能化的 AI 工具却往往需要深厚的技术背景。 而 AutoAgent 的出现,也提供了一种新途径。作为一款完全自动化、零代码的 LLM 智能体框架,AutoAgent 由香港大学 HKUDS 团队开发并开源,堪称 Manus 和 Deep Research 的开源替代方案。 它的目标就是“让 AI 开发无...
马斯克在社交平台宣布,他旗下的大模型平台xAI收购了自己的社交平台X,合并后估值800亿美元。 以下是马斯克的原文官宣: xAI已通过全股票交易收购了X。此次合并中,xAI的估值为800亿美元,X的估值为330亿美元(450亿美元减去120亿美元债务)。 自成立两年以来,xAI迅速崛起,成为全球领先的人工智能实验室之一,以史无前例的速度和规模构建模型和数据中...
全球领先AI平台商汤集团(股票代码“0020”)在官网发布了,截止2024年12月31日止年度全年业绩财报。 数据显示,2024年,商汤的总体收入同比增长10.8%,达到37.7亿元人民币;其中,生成式AI收入突破24.0亿元人民币,同比增长103.1%,这是生成式AI连续两年保持三位数增速,已成为商汤最大业务。 2024年商汤毛利为16.2亿元人民币,毛利...
今天凌晨,OpenAI联合创始人兼首席执行官Sam Altman发布在线急购GPU的消息:如果有人能提供10万单位的GPU资源并能尽快交付,请马上联系我们! 同时正在逐步控制局面。但大家应该预料到,由于我们在应对算力方面的挑战,OpenAI 的新发布内容将会延迟,可能会出现一些问题,并且服务有时也会变得很慢。 仅一个文生图功能,就让GPT-4o这个发布了将...
机器之心报道 机器之心编辑部 OpenAI 终于又要「Open」一回了! 今天凌晨,奥特曼发推宣布,OpenAI 将在未来几个月发布一款具备推理能力的强大新型开放权重模型。 OpenAI 希望与广大开发者、研究者和社区交流合作,探讨如何让这个模型发挥最大作用。OpenAI 非常期待将它打造成为一个非常出色的模型。 开放权重意味着语言模型的训练参数或权重是公...
3 月 31 日,随着 iOS18.4 更新,Apple Intelligence 正式支持包括简体中文、法语、德语、意大利语、葡萄牙语(巴西)、西班牙语、日语和韩语在内的多种语言,并提供新加坡和印度版本的本地化英语。 中文版 Apple 智能 UI 界面 | 图片来源:极客公园 本次更新也是苹果预热已久、苹果在人工智能能力上的更新路线图,如今提前迈出这一...