掌控Moesstm与Moev技术:从SSTM革新到实际应用的深度解析,东西问·汉学家|施寒微:AI如何重塑人文研究的价值与未来?棉花库存持续下降,期货价格触及近3周高点,这些因素值得关注|大宗风云蒲得宇预测 iPhone 17 将延续 iPhone 16 的 8GB 内存。IT之家注意到,另一位苹果分析师郭明錤上个月曾表示 iPhone 17 Air 及两款 Pro 机型均将升级至 12GB 内存,基础版仍在考虑是 8GB 还是 12GB 内存。若蒲得宇信息准确,则表明苹果已确定沿用 8GB 方案,从而更凸显另外三款机型的性价比。
问题:掌控Moesstm与Moev技术:从SSTM革新到实际应用的深度解析
Moesstm和Moev是当前神经网络领域中的两个重要创新技术,它们分别代表了自注意力机制(Supervised Attention Mechanism,SASM)和无监督注意力机制(Unsupervised Attention Mechanism,UAM)。这两种技术的发展及其在机器学习、自然语言处理等领域的实际应用,为我们理解并掌握Moesstm与Moev提供了广阔的空间。本文将深入探讨这两种技术的起源、发展过程,以及在实际应用中的演变。
1. SSTM:自注意力机制(Supervised Attention Mechanism,SASM)
自注意力机制最早是由Google在2013年提出的。SASM的核心思想是基于多模态输入数据(如图像、语音、文本等)进行信息提取和语义识别。SASM通过构建多个层次的注意力模型对输入序列中的关键特征进行集中注意,从而实现自动学习和知识表示。其核心组件包括:
a. 输入层:接收来自各种输入源的数据,如图像、语音或文本。 b. 层次编码器:对输入数据进行一系列的编码和压缩操作,如卷积、池化等,以减小计算量和提高模型性能。 c. 选择性注意层(LSTM):结合卷积层,采用门控单元(Gates)对编码后的输入数据进行分组,确定哪些特征在该部分具有较高的关注程度,并通过加权门控制这些特征的激活方向和强度。这样,只有那些具有较高权重的关键特征被保留,其他无关紧要的信息则会被忽略。 d. 输出层:通过对选择性注意层输出结果的加权平均,获取最终的注意力分布,即对应于每个输入特征的非线性连接权重。SASM的主要优点在于它能够自动地对大量输入数据进行有效选择和过滤,无需人工干预,从而显著提高了模型的泛化能力。
2. Moev:无监督注意力机制(Unsupervised Attention Mechanism,UAM)
Moev由Facebook提出,最初应用于图像分类任务。UAM是一种基于概率密度函数(PDF)的无监督注意力机制,主要适用于大规模、高维的稀疏数据集。其核心思想是利用随机投影(Random Projection,RP)进行空间映射,使得稀疏数据中的重要特征可以直观地表达出来,而噪声和冗余特征则被剔除掉,从而降低过拟合的风险并提高模型的鲁棒性。
Moev的工作原理主要包括以下几个步骤:
a. 随机投影:将输入数据随机投影到低维空间中,如二维的平面上,以简化计算量。然后,使用高斯核(Gaussian Kernel,GK)对投影后的数据进行归一化处理,使其在不同尺度上具有相同的分布。 b. 特征选择:在归一化的投影空间中,通过统计统计量(如均值、方差、协方差矩阵等)来评估每个特征的重要性,选取其中最具影响力的特征作为后续计算的输入。这可以通过计算每个特征在归一化后投影值与其对应的均值之间的距离来完成,从而得到一个正态分布的特征重要度列表。 c. 相互置信区域(Confidence Interval,CI)构建:通过计算每个特征在所有样本点上的CI长度,即可构建出每个特征的置信区间。置信区间的范围越大,表示该特征在总体中的不确定性就越小,越可能用于描述数据的全局结构和趋势。 d. 应用场景:UAM广泛应用于图像分割、目标检测、图像检索等多个自然语言
在首个“文明对话国际日”即将到来之际,6月5日至7日,以“理解中国:人工智能时代的汉学研究”为主题,由教育部中外语言交流合作中心和中国人民大学共同主办的第九届世界汉学大会在中国人民大学深圳研究院举行。
来自50余个国家和地区的近200位汉学家共商汉学在人工智能时代的创新发展之路,为践行全球文明倡议、推动中外文明交流互鉴注入新动能。
德国汉学家、哥廷根大学东亚文学与文化荣休教授施寒微(Helwig Schmidt-Glintzer)是本次大会的特邀嘉宾。20世纪60年代,施寒微以研究中国古典名著开启汉学生涯。如今,他将目光投向人工智能对人文领域的冲击。
面对部分高校调整人文学科的趋势,他在主题演讲中提出:AI是“征服世界”的工具,还是助力“共享世界”的伙伴?大会期间,施寒微接受中新社“东西问”专访,分享了他对人工智能时代人文研究价值的观察与思考。
施寒微:人文专业的调整反映了技术变革下的结构性挑战,但绝非人文价值的消亡。我发现,中国一些高校调整了人文招生规模,这是应对人工智能时代的一种策略性调整。现代社会对人文的需求反而会增强。
人文研究者的核心竞争力在于提出深刻问题、批判性解读与综合能力,这是AI无法替代的。转型关键在于成为“六边形战士”:既要深耕人文传统,也需掌握技术工具。例如,AI可承担流程化任务(如数据处理),而学者应聚焦跨文化对话、价值反思及复杂文本的创造性阐释。
人文教育培养的是理解人类关系(如《红楼梦》对人际关系的揭示)、批判性思维及文化认同构建能力。若我们能以技术拓展人文边界(如利用AI分析古籍或构建全球文明数据库),传统研究者非但不会失业,反而将引领“新轴心时代”的智性革新。
2025年6月6日,第九届世界汉学大会在广东深圳开幕,著名汉学家施寒微参加平行会议并发表题为《征服世界还是共享世界:人工智能的核心命脉何在》的演讲。记者 陈楚红 摄
施寒微:AI生成选题多基于现有数据模式,而人文研究的核心优势在于提出颠覆性命题——例如追问现代化进程中文明身份的重构,或“轴心时代”伦理如何回应AI引发的全球性危机。
在我看来,人文研究者的核心竞争力在于“问题意识”与“综合批判力”。AI可基于数据生成选题,但无法触及“轴心时代”的终极关怀——如第一个“轴心时代”的道德敏感度(约翰·托尔佩理论)或第三个“轴心时代”所需的全球公民意识。研究者需追问如“和谐社会的传统如何应对AI伦理危机”等融合历史与未来的命题。
此外,当AI承担流程化任务(如文献梳理),学者应转向整合不同国家和地区专家学者的观点,构建跨文明对话。人文研究可参照“双螺旋结构”,以传统文化复杂性约束技术霸权,以AI增强跨文明理解能力,例如通过机器翻译时,学者需主导价值选择。
AI对《红楼梦》的速读可能提供表面隐喻,却难触及清代史学家章学诚所称的“恕”,即设身处地为他人着想——这种基于文化浸润的共情能力,需长期文本精读与生命体验。
中国学生通过《红楼梦》学习人际关系解读,其价值在于文本与读者生活的互动生成意义。汉语涉及的多地方言、历史语境及未言之意(如庄子“能止”的哲学),要求学者在创造性诠释中激活传统。
AI翻译虽便捷,却可能消解语言多样性。因此,文本分析能力非但未被淘汰,反而因AI的“浅层化”风险更显珍贵——它要求学者以德国社会学家哈特穆特·罗萨(Hartmut Rosa)所说的“共鸣敏感度”,深耕语言细节,重视倾听和旁听,掌握适时停止的能力,将技术工具转化为深化人文洞察的桥梁。
2025年6月6日,第九届世界汉学大会在广东深圳开幕,著名汉学家施寒微(右)倾听嘉宾提问。记者 陈楚红 摄
施寒微:章学诚提出的“恕”是建立信任与文明的基础,需基于个人命运与文化归属感。当前,AI可模拟基础情感反馈,但无法实践德国哲学家哈贝马斯(Jürgen Habermas)要求的“敏锐相互换位思考”,即在话语中权衡所有受影响者的利益并自我调整。
AI可作为增强工具辅助文化体验(如实时翻译学术讲座),但真实理解仍依赖“精读”训练。而精读《论语》需结合自身社会关系,实践“仁”。这是目前机器尚未抵达的领域。
施寒微:借助科技建设更包容的世界,不是对AI进行简单数据输入,而是以文明互鉴重塑技术哲学。从不同文明中寻求智慧,转化为AI的伦理架构。
具体来说,可以通过辩证训练,将《浮士德》《庄子》等多元经典纳入机器“集体记忆”,提升文化互补性,培育多维价值判断。此外,通过建立冲突预防机制,比如借鉴澶渊之盟的和解智慧,训练AI模拟文化冲突的谈判路径,使机器成为“第三个轴心时代”的伦理伙伴。
施寒微:“第三个轴心时代”的思想主要集中在技术对人类认知和精神世界的重塑。在这种情况下,人文研究更有探讨价值。在人生意义层面,如有学生阅读《红楼梦》是为“理解人类本身”,其生命困惑无法被AI答案消解。在文明存续层面,“轴心时代”的伦理遗产(孔子、苏格拉底等人的理论)需人类在技术狂潮中主动抉择——例如用章学诚所提到的“恕”,平衡AI效率逻辑。在批判自由层面,AI论文依赖既有数据,而人类可挑战传统,甚至质疑AI自身(如哈贝马斯反对“技术代理冲突”)。
2025年4月29日,“2025梦想天堂:AI机器人酷玩乐园”在浙江杭州开园。小朋友体验与“苏东坡”时空对话。记者 吴君毅 摄
汉学研究的本质是“理解转型中的中华文明”,其反思性、批判性与创造性,使人类在技术革命中保有定义自身价值的主动权。如今伴随着技术的进步,AI也能写论文,恰证明人文教育更需聚焦提问的勇气与共情的深度。唯此,人类才能在机器时代守护“人之为人”的尊严。(完)
施寒微。 记者 陈楚红 摄
施寒微(Helwig Schmidt-Glintzer),德国汉学家、德国哥廷根大学东亚文学与文化荣休教授。截至2023年底担任德国图宾根中国中心主任、资深教授。其著述颇丰,专著多达几十部,涉及中国思想、宗教、历史、文学、语言等诸多方面。
本报(chinatimes.net.cn)记者叶青 北京报道
受宏观情绪提振,6月9日棉花期货价格大幅拉升,主力2509合约延续上行走势,盘中一度触及近3周来高点13550元/吨,最终报收于13495元/吨,单日涨幅达1.09%。数据显示,今年4月初以来,棉花期货价格呈先跌后涨走势,累计涨幅达6%。
“近期棉花期货价格上涨,一方面源于棉花现货走货加快,商业库存去化提速,市场预期新棉上市前供应可能偏紧。另一方面,市场宏观预期改善,对棉花的悲观消费预期有所缓解。”银河期货分析师刘倩楠在接受《华夏时报》记者采访时表示。
棉花库存走货加快
据了解,棉花期货价格自4月9日下探至12490元/吨后止跌,随后维持区间震荡,一直到6月9日期货价格再次出现上涨,盘中还一度上冲至13550元/吨。对此,刘倩楠表示,从基本面情况上看,近期棉花商业库存去化速度显著加快。
据中国棉花信息网数据,截至5月底,全国棉花商业库存为345.9万吨,较4月末减少69.4万吨。自3月起,月度降幅均超60万吨,去库速度处于近年同期高位。对此,刘倩楠表示,市场担忧如果按照目前的去库速度,到年度末期棉花供应可能会偏紧。
此外,据国家统计局数据,4月份的服装、鞋帽、针纺织品类零售额为1088亿元,同比增长2.2%,处于历年同期高位。出口方面,受美国加征高额关税影响,我国纺织服装类产品对美出口量有所下降。不过,刘倩楠指出,近年来国内企业积极开拓其他市场,对冲了对美出口下滑的影响。
对此,中信期货资深研究员吴静雯指出,从纺织品服装消费数据看,今年出口金额及内需零售额均保持同比正增长。从耗棉量看,国内纺纱厂持续投产,而新疆新投产纱厂多为大产能企业,这些企业凭借成本优势维持较高开工率,新投产企业普遍满负荷生产,推动棉花刚性需求增长,这与近几个月棉花商业库存快速去化相互印证。
除了下游需求增加外,国内棉花产量也出现变化。对此,吴静雯指出,2025年新疆棉花种植面积预计增长,其他农作物改种棉花现象较为普遍。此外,截至目前新疆整体气候条件适宜,除巴州等个别地区遭遇阶段性灾害外,大部分地区苗情良好,部分地区苗情优于去年。因此,若后续不发生极端天气,今年单产预计维持较高水平。