企业里80%的数据是非结构化的——图片、文档、语音。不会处理这些数据,AI就只能做一半的事。
这门课程带你建立Azure平台上视觉与文档智能的完整能力——不是让你成为算法专家,而是教你用现成的AI服务解决真实的业务问题。发票怎么自动录入?合同怎么智能审核?图片里的信息怎么提取?这些场景学完就能上手。
先回顾语言基础,再拓展多模态——第一章的NLP回顾不是重复,是建立统一的AI认知框架。语言理解是地基,视觉和文档是上层建筑。
语音是交互的入口——第二章的语音服务与对话式AI,让应用从"看得懂"变成"听得见、说得出"。语音识别、语音合成、对话机器人——这些能力让用户体验从点击升级到自然交互。
视觉是感知的延伸——第三章的理论基础帮你理解CNN、Transformer、扩散模型这些核心技术原理,不是背概念,是知道什么时候该用什么技术。第四章的Azure实操则是真刀真枪:人脸检测、OCR光学字符识别、物体检测、图像深度描述——每一个都能直接嵌入业务系统。
文档智能是效率的杠杆——第五章的文档智能与内容理解,解决企业最痛的痛点:票据分析、发票提取、表单处理。不是人工录入再核对,是AI直接读、直接填、直接审。
最后一章总结与考试指导——把前面所有能力串成体系,为认证考试做最后准备。
六章内容构成"回顾-语音-视觉理论-视觉实操-文档智能-总结"的完整多模态AI应用闭环——从NLP语言回顾起步,建立语音服务与对话式AI能力,深入计算机视觉理论基础,通过Azure AI Foundry完成视觉实操(人脸检测、OCR、物体检测),掌握文档智能与内容理解(票据分析、发票提取、表单处理),最终以课程总结与考试指导完成知识整合。
不是单一技术的浅层介绍,而是从理论到实操的完整视觉与文档智能开发路径——覆盖语音、视觉、文档理解三大AI能力域,以Azure平台为载体实现企业级应用落地。
从听到看到读到理解,让你的AI应用真正看懂企业数据。
课程有效期:
自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。
上课模式:
课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。
注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。