百度这次再往AI眼镜里塞了一把“猛料”。官方正式发布的全新AI拍摄眼镜——小度AI眼镜Pro,定位仍走时尚、便携的随身影像路线,但在核心能力上实现了“多模态AI智能助手”的全面升级。重92克级的外部认知被重新分配到更轻盈的佩戴体验上,眼镜自重39g、两款框型并存,售价2299元起。这一组数据并非简单的参数堆砌,而是对“日常场景中的智能入口”进行了更强的 UX/生态绑定。随设备一同上线的,是小度科技全新发布的多模态AI智能助手——超能小度,它不仅支持语言交互,还具备多模态感知、识物、备忘、翻译、声音复刻等能力,仿佛把百科、工作记事、娱乐体验以及跨语种沟通融入同一副眼镜之中。为附加价值加分的还有一个名为“氛围歌单”的联动功能——由小度与网易云音乐共同打造,能够根据场景自动匹配应景曲目,给日常使用增添一抹情绪温度。图像中这套组合的实际呈现,与官方对外披露的信息高度一致,用户将获得“看得见的智能、用得上的场景化体验”。
超能小度上桌了
这次小度AI眼镜Pro最核心的亮点,是它把多模态AI智能助手“超能小度”直接嵌入眼镜之中。与此前仅靠硬件叠加实现智能的路径不同,超能小度强调的是跨模态协同:语言交互 + 图像理解 + 上下文语境的综合反馈能力,远比单点识别更接近“对话式、情境化”的使用习惯。具体到功能层面,眼镜具备以下关键能力。
首先是AI识物能力的升级。基于物体识别的基础之上,超能小度将识别结果与上下文信息结合,给出更具实用性的智能回答与建议;并且与视觉AI+百科数据库深度联动,覆盖植物、商品、艺术品等2000+类别。简单场景演示:当用户对着某个物品说出“这是啥”,小度会给出对象信息并给出后续动作建议,像是在眼镜里装入一本可随时查阅的百科全书。此处的“百科+情境解答”思路,代表了从“识别单点”向“语境驱动的知识服务”转变的方向。相关信息与示例,来自官方对外披露的能力清单与实拍演示。

AI备忘与多模态输入
在日常工作与生活场景中,记笔记的痛点往往在于场景耦合与动手难题。小度AI眼镜Pro引入的AI备忘功能,支持语音与拍照两种模态输入,能自动生成图文笔记并以便捷的方式进行检索回溯。比如在商场逛街时记下停车位、货架位置等信息,用户只需发出“记一下”的指令,系统就会自动拍照并产出可检索的备忘条目;后续再问“我刚才把车停在哪?”即可调出对应记录。这一能力直接降低了从感知到落地执行的认知成本,提升了眼镜作为“日常随身助手”的可用性。此项特性在用户体验设计上具有明显的“手持设备替代”的落地潜力。官方描述也强调备忘与拍照两端的无缝协同,属于多模态协作的典型场景。
同时,这次升级把翻译能力提升到新的时效与专业维度。小度眼镜Pro实现了约3秒内的实时字幕播报,跨语种翻译覆盖包括法律、医疗等数十类专业术语。对比行业常见的翻译时延,这一改动明显提升了跨场景沟通的效率,尤其在差旅、商务会议、跨境购物等情境中,用户对“可落地的实用性”将有更直接的感知。对于企业用户而言,快速、可控的外语沟通能力将显著降低语言壁垒带来的摩擦成本。眼镜端到端的实时字幕能力,与云端检索、知识库集成形成协同,提升了对话的连续性和信息的可追溯性。相关技术细节与演示来自官方披露的技术路线与场景化应用示范。

影像、镜头与续航的综合升级
技术规格方面,眼镜搭载第一代骁龙AR1平台,为影像处理、无线连接与音频体验提供更扎实的基础支撑;镜头方面,搭载索尼1200万像素传感器,1G+5P光学镜头组合,支持4K拍照与1440p/30fps防抖视频。对于“随身影像设备”的定位而言,Pro在硬件层面的升级使得画质、稳定性与场景适配性显著提升,形成了比以往更接近独立便携影像设备的使用体验。除此之外,眼镜还具备自研的EIS智能防抖算法,在跑步、骑行、滑板等动态场景下,画面稳定性得到明显改善。镜头位角与广域景深的结合,为城市风景与日常记录提供更宽广的取景空间。与此同时,官方披露的日常续航约7.5小时,若使用充电盒,综合续航可延长至68小时,基本覆盖一整天的使用需求。这一硬件+续航的组合,进一步拉开了与以往“短时使用、易疲劳”的眼镜产品之间的距离。

上市节奏、生态与产业镜像
据官方信息,波士顿框型的“波士顿墨镜”款已率先上市,随后“光致变色镜片”款以及猫眼款将在12月陆续发售。这一阶段的产品线布局,显然是在试探不同消费群体的偏好与搭配需求。更重要的是,除硬件与算法能力外,百度也在通过生态层面的协同来提高产品的实际使用频次:AI翻译、AI识物、AI备忘、氛围歌单、以及办公场景中的“会议智能洞察”等场景化能力逐步落地,形成从“单一功能卖点”向“复合场景入口”的演进路径。尽管如此,关于不同市场的合规边界与隐私保护仍将成为影响功能边界与版本策略的关键变量。官方清晰提出了合规与隐私保护的落地路径,但在不同地区的监管差异,仍会带来产品形态和默认设置的差异化。此点也值得产业链上游在落地时进行充分的边界设计与用户教育。
在市场生态层面,这一波“多模态眼镜+生态协作”的组合,暗含两条潜在的商业逻辑:一是以平台能力作为入口,硬件提供体验端,内容与数据治理方参与,形成“入口-场景-数据-应用”闭环;二是通过专业领域的翻译、识物、备忘等能力,培育高粘性使用场景,从而提升眼镜的日常使用频次与留存。这一逻辑,与近一年AI眼镜行业在硬件、算力、内容与合规三者协同推进的趋势高度吻合,且有望在企业级与消费级市场都得到验证。
引述与佐证
官方资料与现场演示明确指出,Pro将“AI识物、备忘、翻译、音色复刻”等能力整合到一款轻量化穿戴设备中,并在专业术语翻译和现场场景理解方面进行了显著提升。行业分析普遍认为,这类多模态入口的落地,将推动上下游在传感器、算力、算法以及云边协同方面形成更紧密的分工与协作,推动“设备 + AI 服务 + 场景数据”的生态闭环成为新的增长点。以上结论以官方披露与现场演示为依据,并结合业内对多模态AI眼镜生态的长期判断。
背景与上下文
就行业背景而言,AI眼镜正在从“功能堆叠”向“情景入口+生态闭环”的方向演进。不同厂商在识别、翻译、语音合成、场景分析等模块的权重分配上各有侧重,但共同点是将算力放在更贴近场景的边缘端,以降低延迟、提升隐私保护水平,并通过生态协同扩大应用边界。百度的此次发布,恰逢行业对“可落地场景”的信心回升,同时也对合规边界提出了更清晰的要求:在不同国家与地区,默认设置、数据处理提示与权限粒度都会呈现差异化,以确保用户对数据的掌控权和隐私保护。
结语与展望
从这轮升级看,AI眼镜正在逐步成为“可穿戴的多模态入口”,而非单纯的拍照/翻译设备。对于开发者与投资者而言,机会在于:打造更丰富的场景模板、把专业领域术语翻译的闭环做深做透、以及通过会议洞察等高价值应用提升企业级用户对眼镜的依赖度。对消费者而言,真实的考验在于“体验的连贯性”和“隐私边界的清晰度”两条线。若百度在合规、场景数据治理与生态协作方面持续深耕,下一波增长点可能来自企业级场景的深度落地、跨场景的一体化服务,以及更多“看得见、用得上的场景化能力”落地。
参考来源
- 量子位(QbitAI)报道:百度发布小度AI眼镜Pro 与超能小度多模态助手(链接)
- 百度官方新闻稿:小度AI眼镜Pro 正式发布——多模态助手、AI识物、实时翻译与AI备忘等能力(链接)
- 网易云音乐:氛围歌单联动公告(链接)
- 小度AI眼镜Pro 官方展示图与规格图片:https://simg.baai.ac.cn/hub-detail/0d54caec77087f99161bb2b1b392858d1763350201427.webp
- 小度AI眼镜Pro 识物示例图:https://simg.baai.ac.cn/hub-detail/a75c22b64aad2ae073b8caa5985ada711763350201429.webp
- 小度AI眼镜Pro 4K/防抖等影像演示图:https://simg.baai.ac.cn/hub-detail/86e0f387ac202dc26ca84dbe74b820261763350201429.webp
注:
文中对“超能小度”与“AI识物、AI备忘、氛围歌单、会议智能洞察”等能力的描述,均以官方披露信息为基础,同步结合行业对多模态入口发展趋势的分析进行解读。若后续官方给出更多权威数据,我们将第一时间更新与补充。
