文章转载自「白鲸出海」 AI 时代下,小团队创业正在成为一种趋势。AI 的到来可能已经彻底改变了团队疯狂扩张、多轮融资的传统创业叙事。 近日,一份名为「顶尖精益 AI Native 公司排行榜」的名单在 linkedin 引发广泛关注,这份名单细致罗列了 31 家团队规模较小(少于 50 人),但营收非常可观(ARR>500 万美元)的初创公司。 名...
让AI买东西的日子,越来越近了。 根据Visa最新数据,AI Agent访问零售网站的流量同比增长了1200%。从ChatGPT Search的智能推荐到亚马逊的跨平台购物助手,Agent电商看似已触手可及。 但在这个过程中,有一个环节始终绕不过去:那就是支付。简单来说,现有金融系统无法适配“无卡无人”的自动化交易。 如此一来,Agent的支付环节就成了A...
文| 杨柳 松延动力接住了流量红利。这家因人形机器人半程马拉松而名声大噪的初创公司,提前完成了今年的销售目标——已卖出超2000台机器人,合同销售额过亿元。 短短2个多月实现销量蹿升,松延动力创始人姜哲源知晓这是短期流量带来的客户。他在5月下旬接受南都记者采访时说,公司将流量转化为订单的同时,也在搭建销售渠道体系,把短期的流量红利变成长期的商业化优势。 2...
文丨丁灵波 时隔一个月,小米大模型又有新动作。 今天,小米大模型Core团队推出多模态开源模型MiMo-VL-7B系列,同时提供了MiMo-VL-7B-SFT和MiMo-VL-7B-RL两款视觉语言模型,这两款模型在通用视觉理解和多模态推理任务中实现了先进性能。 该团队在技术报告中表示,在40项评估任务中,MiMo-VL-7B-RL在35项任务上超越了...
前几天,DeepSeek R1更新了 然而他们就只是悄悄在微信群里面发布了这个消息。 说是一个小版本试升级 于是我带着强烈的好奇走上了这条一波三折的测评之路。 心情真的是起起伏伏 我一开始测试了好几个Case,有写作的,有代码的,有数学的。 初步觉得效果确实有提升,程度比官方说的高一点,但是离顶尖模型Claude4还是有明显差距。 比如测试生成的城市智慧交...
Avengers团队 投稿 量子位 | 公众号 QbitAI 近年来,语言模型技术迅速发展,然而代表性成果如Gemini 2.5Pro和GPT-4.1,逐渐被谷歌、OpenAI等科技巨头所垄断。 与此同时,开源社区的小规模模型正面临日益严峻的挑战—— 他们参数规模通常仅在7B左右,难以在多任务、多领域场景中与大型闭源模型相抗衡,尚未形成真正意义上的通用人工智...
MME-VideoOCR团队 投稿 量子位 | 公众号 QbitAI 多模态大模型(MLLM)在静态图像上已经展现出卓越的 OCR 能力,能准确识别和理解图像中的文字内容。 然而,当应用场景从静态图像拓展至动态视频时,即便是当前最先进的模型也面临着严峻的挑战。 MME-VideoOCR 致力于系统评估并推动MLLM在视频OCR中的感知、理解和推理能力。 主...
金磊 发自 凹非寺 量子位 | 公众号 QbitAI 现在,请大家一起数一下“1”、“2”。 OK,短短2秒钟时间,一个准万亿MoE大模型就已经吃透如何解一道高等数学大题了! 而且啊,这个大模型还是不用GPU来训练,全流程都是大写的“国产”的那种。 这,就是华为通过“昇腾+Pangu Ultra MoE”这套组合拳解锁的效果—— 不仅实现了国产算力与国产模...
编译|冬梅、核子可乐 Stable Diffusion 模型缔造者们建立的初创公司 Black Forest Labs(黑暗森林实验室,简称 BFL)刚刚发布了发布一款名为 FLUX.1 Kontext 的全新图像生成模型。此模型不仅能够生成和编辑照片,还允许用户添加文本及其他图像以实现内容修改。 该公司在 X 上发文称:“今天我们正式发布 FLUX.1...
梦晨 发自 凹非寺 量子位 | 公众号 QbitAI AI生图新突破!一个模型同时接受文本和图像输入。 新模型FLUX.1 Kontext使用流匹配架构(Flow Matching),不再是文本编码器和扩散模型各干各的,与此前技术都不同。 最来自之前很火的Black Forest Labs,官方表示这一次能做到真正的上下文生成和编辑。 在编辑能力上,有人在...