专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注! 图像超分辨率是计算机视觉中的一个基础任务,其目标是从低分辨率图像中重建出高分辨率图像。这一技术在多种低级视觉任务中扮演着重要角色,包括去模糊、去雾、去雨和低光照增强等。 传统的方法通常...
AI开源,看中国。 作者 | ZeR0 编辑 | 漠影 太卷了!太卷了! 智东西8月2日报道,刚刚,知名AI大模型评测Chatbot Arena放榜! 阿里Qwen3-235B-A22B-Instruct-2507位列大语言模型总榜第三,月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528并列为总榜第五,以开源...
谷歌把拿金牌的模型,开放给了至尊版订阅用户。 作者 | ZeR0 编辑 | 漠影 智东西8月2日报道,昨夜,谷歌推出其迄今最强推理模型Gemini 2.5 Deep Think。 这是最近在今年国际数学奥林匹克(IMO)上“拿金牌”的模型的变体。近期高级版Gemini Deep Think完美解答了IMO 6道题目中的5道,总分35分(满分42分)...
给专业导演配齐创作助手,还帮远洋海员实现“视频自由”。 作者 | 陈骏达 编辑 | 漠影 起猛了,AI现在都能生成武打戏了,还是人虎搏斗的那种! 近日,一条名为《风入松》的AI短片,在年度AI盛会WAIC期间亮相,吸引了不少眼球。这部影片以现代废土风,重新演绎了经典的“武松打虎”故事。 ▲AI短片《风入松》片段 画面中,主角的动作流畅有力,老虎的毛...
©作者 | 赵克森 单位 | 南洋理工大学博士生 研究方向 | 强化多模态大语言模型 随着文本领域中思维链(Chain-of-Thought,CoT)推理机制的成功应用,研究者开始将该方法引入视觉理解任务,以提升模型的推理能力和可解释性。 然而,现有模型局限于文本级别的思维链推理,且处理图像的粒度固定,难以根据语义线索动态关注图像中的关键区域。针对上述问题...
给视频加字幕、翻译字幕,之前这类开源也给大家推荐过,今天找到一个更好一些的。 像是给视频加字幕,这个剪映也能干,但是说实话,准确率还是差了点,而且剪映现在也涨价了,38块钱一个月了。 翻译字幕剪映干不了,自己要是一条一条的去翻译真会把人搞崩溃。 今天给大家推荐的VideoCaptioner,各方面做得都还不错,时间戳(保证字幕跟视频对齐)、字幕校正这些有了...
多知8月1日消息,深圳云天励飞技术股份有限公司Shenzhen Intellifusion Technologies Co., Ltd.(以下简称云天励飞)在港交所递交招股书,拟香港主板IPO上市。云天励飞(688343.SH),于2023年4月4日在A股上市。 招股书显示,在过去的2022年、2023年、2024年和2025年前三个月,云天励飞的营业收入分...
这几年,全球监管全面收紧。 欧盟 GDPR最严重可罚企业全球营收的4%,“没证上岗”轻则丢标,重则吃罚单。在一片高压之下,企业对“合规”的需求前所未有地刚性。 而就在这种环境下,一个AI拿证助手火速出圈,它就是Vanta。 7月,Vanta宣布完成1.5亿美元D轮融资,估值达到41.5亿美元,累计融资超5.04亿美元,半年内行业地位迅速跃升: Q2市其合...
文|南都记者 杨柳 南都N视频记者8月1日获悉,智元机器人近期获得两家韩国资本的战略投资,由LG电子(LG Electronics)、韩国未来资产集团(Mirae Asset)联合领投。这是LG电子在具身智能领域的首次对外布局。 此前7月15日,智元还披露获得正大集团旗下正大机器人的战略投资,以推进在新零售、新消费、康养服务等垂直领域的探索开发。正大集...
制造业和人工智能可谓是上海当前支撑力最重要的两个行业,一个是实体经济的根基,一个是新兴产业,一个硬,一个软。 文|徐杰 黄心怡 全球AI领域备受关注的世界人工智能大会刚落幕,上海抓紧又忙活起来了。 日前,上海市政府常务会议原则同意《上海市加快推动“AI+制造”发展的实施方案》。该文件明确,必须把握人工智能赋能制造业的战略机遇,以AI驱动制造业高端化、智能...