彩云网漏洞|彩云网app下载
彩云网客户端下载2023-01-31 16:05

彩云网漏洞

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

古籍如何兼顾“藏”与“用”******

古籍如何兼顾“藏”与“用”

——来自古籍数字资源联合发布会的专家观点

光明日报记者 陈雪

  “古籍具有特殊性,作为文物必须保护,作为文献必须为读者所用,二者存在矛盾。”——解决“藏”与“用”之间的矛盾一直是古籍工作的重点,山东大学文学院院长、教授杜泽逊说:“数字化是目前最好的办法”。

  1月4日,国家图书馆(国家古籍保护中心)、天津图书馆、南京图书馆、云南省图书馆、苏州图书馆、中山大学图书馆等6家单位,在线召开了古籍数字资源联合发布会,发布了6786部(件)古籍资源,可在线免费阅览全文影像。会上,多位古籍专家学者围绕古籍数字资源建设进行了深入讨论。

  古籍数字化有何迫切性?未来趋势是什么?专家学者展开了深入探讨。

  数字化平衡“文物性”与“文献性”

  20世纪90年代初,上海图书馆把内部使用的古籍目录卡片摆在图书馆的走廊里,为了完成“四库全书存目丛书”的版本调查,杜泽逊跑到上图,查阅了十几天卡片。夏天高温,他就到馆外买一根绿豆冰糕含在嘴里,再回到馆内查卡片——为查阅古籍文献,要出差到各地,克服各种困难,这是一代古籍研究者的集体记忆。

  “从内部使用到目录卡片放在走廊,再到数字资源挂在网上,这个进步是非常快的。”杜泽逊说,国家图书馆为首的几十家图书馆把古籍数字资源放在网上,读者不必直接使用古籍原件,这是很重要的一条保护措施。此外,在线阅览不知道节省了多少人的时间、体力、财力,对推进新时代古籍工作有重大贡献。

  兼顾“藏”与“用”,古籍数字化刻不容缓。“国家图书馆从2000年起开始有计划地将古籍进行数字化,并陆续建成数字方志、碑帖精华等专题库,面向社会公众发布。”国家古籍保护中心办公室负责人王红蕾介绍了古籍数字资源发布的整体情况。2016年,国家图书馆搭建“中华古籍资源库”平台,发布了国图馆藏善本和普通古籍、甲骨、敦煌文献、碑帖拓片、家谱、老照片等数字资源,以及天津图书馆、哈佛燕京图书馆等许多馆外古籍和海外征集古籍资源。2021年疫情期间,读者远程访问需求增长,为回应读者的“急难愁盼”,“中华古籍资源库”实现了免登录阅览。资源库上线、免登录阅览被学者称为惠及学林的两个重要节点。

  2007年以来,随着“中华古籍保护计划”的深入开展,各地图书馆陆续投入人力物力,大力推进古籍数字化。苏州图书馆党委书记、馆长接晔介绍,截至目前,苏州图书馆已完成数字化古籍1496部,容量达16.12TB。

  据了解,国家图书馆(国家古籍保护中心)先后联合39家单位发布古籍资源2.8万部(件),此次是第七次联合发布,6家收藏单位新增发布古籍资源6786部(件),不仅有明清版刻、稿抄本古籍,还有碑帖拓本等特色资源:新增国家图书馆藏古籍数字资源1075部19.2万叶,主要为年谱类、目录类古籍;天津图书馆发布馆藏稿抄本文献165种655册;南京图书馆发布了“清人文集数据库”,共收录清人文集399种,以全本彩色扫描的方式制作成数字影像;云南省图书馆发布馆藏善本63部381册,图像50604拍;苏州图书馆发布馆藏古籍数字资源888部;中山大学图书馆发布了一批颇具该馆特色的碑帖文献数字资源。

  本次资源发布后,全国累计发布古籍及特藏文献影像资源达到13万部(件),其中,国图建设的“中华古籍资源库”发布超过10.2万部(件)。王红蕾说,“中华古籍资源库”已成为全国古籍资源类型和品种最多、体量最大的综合性资源共享发布平台。

  北京大学中文系古典文献学教研室主任、教授杨海峥感叹,从2016年到现在,陆续推出了13万部(件)古籍数字资源,对于学者来说是非常重要的一件事情。在线查阅免去了往返奔波各家图书馆的时间,缓解了古籍“藏”和“用”之间的矛盾,平衡了古籍的文物性与文献性。

  古籍资源既要“用得上”,还要“用得好”

  2022年10月,全国古籍整理出版规划领导小组印发实施《2021—2035年国家古籍工作规划》,“国家古籍数字化工程”正是四项重点实施工程之一。近年来,全国古籍登记工作让3000万册件古籍有了“身份证”,未来,让更多古籍“上线”与读者见面,将是我国古籍工作的一大重点。

  “古籍数字化资源的制作与发布,其实是回归到古籍作为书籍文献本来的性质。”清华大学科学技术史暨古文献研究所研究员刘蔷说,以往,人们说学术的繁荣与学术资料的新发现有关,这种说法是忽视了存世的大量古籍,存世古籍是一个巨大的资源库。可以预见,连续的古籍资源发布,将带来宏阔的学术气象。

  古籍数字化平衡了“藏”与“用”的矛盾,让古籍资源“用得上”,未来,更要“用得好”。学者们对古籍数字资源的深度利用提出了许多有益建议。

  浙江大学图书馆研究馆员黄晨认为,古籍数字资源联合发布可以更好地呈现资源的利用价值,接下来,可以进一步就已发布的资源进行深度揭示,进一步打通资源和发布平台,提供一站式检索,将资源聚合起来,这样的利用效果会更好。刘蔷也表示,期待能有一个与古籍数字化资源相匹配的古籍数字目录,以便实现一站式检索。

  杨海峥认为,目前古籍数字化发展迅速,百花齐放,各类数据库和古籍数字化平台纷纷涌现,多样化的发展一方面带来了很大便利,另一方面也应进行协调统一,建立更加规范的数据规范标准,使得古籍数字化的资源有保证,达到方便使用的学术水准。杨海峥说,2022年中办、国办印发的《关于推进新时代古籍工作的意见》,专门强调要“加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享”,国图联合全国古籍存藏单位把古籍数字资源进行统一与整合,形成公益性平台,奠定了非常好的基础,是未来古籍数字化的发展趋势。

  汇聚、开放、共享,古籍数字化的步伐不断加快。杜泽逊说,“期待发布更多的数字资源,最终达到除少数特殊情况外,全部数字化。”

  《光明日报》( 2023年01月06日 09版)

中国网客户端

国家重点新闻网站,9语种权威发布

彩云网地图