**关注我,记得标星不迷路哦~ 1: Vibe Draw Vibe Draw是一个通过涂鸦草图快速生成3D模型的工具,让创意轻松转化为3D世界。 Vibe Draw 是一个旨在让任何人都能轻松进行 3D 建模的工具。它允许用户通过简单的 2D 草图,将其转换为精美的 3D 模型并构建 3D 世界。 核心功能: 2D 草图绘制: 用户在 2D 画布上自...
谷歌Gemini 2 flash发布后不久, OpenAI的ChatGPT 4o也发布了自然语言P图功能, 甚至引发了美国人全民“吉卜力”热潮。 事实上,AI重绘功能,是MJ、Stable Diffusion至少用了两年的基本功能之一。 为什么之前没有那么火? 其实和LLM的基本逻辑有关。 长期以来,MJ、Stable Diffusion的玩家是个小众群体,...
「仅需一次前向推理,即可预测相机参数、深度图、点云与 3D 轨迹 ——VGGT 如何重新定义 3D 视觉?」 3D 视觉领域正迎来新的巨变。牛津大学 VGG (Visual Geometry Group) 与 Meta AI 团队联合发布的最新研究 VGGT(Visual Geometry Grounded Transformer),提出了一种基于纯前馈 ...
目前,微软、OpenAI、亚马逊、谷歌、Salesforce、甲骨文、Meta、阿里、百度等科技巨头都在重金押注Agent智能体赛道。而国内还跑出了被誉为“第二个DeepSeek”的大黑马Manus,在全球范围产生巨大影响。 所以,Agent智能体已成为创业、就业的新风口。既然大好的机会来了应该如何入门呢?如何快速弄懂这些技术概念,分一杯羹呢? 因此,微软免...
快速发展的搜索引擎技术和大型语言模型(LLMs)的集成主要有利于像谷歌的GPT-4o搜索预览和Perplexity的Sonar Reasoning Pro这样的专有解决方案。虽然这些专有系统提供了强大的性能,但它们的封闭源代码性质带来了重大挑战,特别是在透明度、创新和社区协作方面。这种专有性限制了定制并阻碍了对增强人工智能的更广泛学术和创业参与。 为了应对这...
“分身”这个词大家一定不陌生,最开始可能在玄幻小说中了解到,现实中最常见的就是你的手机和APP的“分身”。 其实,“分身”的核心在我们互联网科技圈也可以理解为多进程。现在 AI 技术大火,那么 AI 有没有“分身”,答案是肯定的。我们每天都在用不同场景、不同角色的AI分身功能。 但传统的 AI 助手往往依赖云端计算,用户数据随时可能被采集和分析。我们需要一个...
昨晚,豆包终于上了之前很多人期待的功能。 深度思考。 我之前用别人的账号体验过这功能,就是推理模型,而今天看到的第一刻,我以为的是,豆包的推理模型终于全量上线了。 但是当我体验了一下以后,发现他们这个深度思考,跟之前的推理模型、还有其他的AI联网还真的有点不太一样。 它不止是是个推理模型,还直接把思考和搜索,给融合在了一起,有点DeepSearch那个做法...
很难想象,在美国,医疗笔记可是一个大生意。 因为医生需要记录每位患者的诊疗过程。由于工作过于繁琐,在很多年前,这些高收入的医生就已经将医疗记录的工作外包出去。在美国,大约有10万名医疗抄写员,占到了医生总人数的1/10。 而现在,这个市场正在被AI全部吃掉。根据Statista数据,AI医疗笔记的潜在市场规模约为39.6亿美元,是当前整个医疗GenAI应用...
文| 杨柳 3月27日,阿里宣布开源Qwen2.5-Omni,这是通义系列模型中首个端到端全模态大模型。 据阿里介绍,Qwen2.5-Omni可同时处理文本、图像、音频和视频等多种模态数据的输入,并实时生成文本与自然语音合成输出。 相较于GPT-4o、Gemini-1.5-Pro 等数千亿参数的闭源大模型,Qwen2.5-Omni仅有70 亿参数。阿里表示...
美国企业敦促政府推出机器人国家战略,以促进智能机器人行业发展,建立联邦办公室,推动全球竞争中下一代机器人的开发。 作者 | 刘蕊 继芯片、人工智能等产业之后,美国政府和国会接下来可能将考虑把智能机器人行业的发展纳入“国家战略”。 美东时间周三,包括特斯拉、波士顿动力(Boston Dynamics)和敏捷机器人(Agility Robotics)在内的多家...