国内最专业的IT技术学习网

UI设计

当前位置:主页 > UI设计 >

不同的语言,相同的信息:17种语言研究揭示如何

发布时间:2019/09/16标签:   语言    点击量:

原标题:不同的语言,相同的信息:17种语言研究揭示如何
大数据文摘出品编译:李世林、刘俊寰假如预备去另一个国度游览,最使人头大的确定是言语欠亨的成绩,偶然乃至还会埋怨言语的分类过于细化。然而,里昂大学研讨职员的一项新研讨标明,言语之间的差别能够比设想的要小。“言语在音节所包括的信息以及谈话的速率方面差别很大。但有味的是,这两种言语是彼此均衡的,因而信息麋集的言语说得慢,而信息较少的言语说得快。这象征着差别言语之间有一个十分类似的稳固的信息率。”该研讨的独特作者,来自里昂大学的言语能源学试验室研讨员Dediu说道。通用常数的探访在试图为言语找到一个“通用”常数的进程中,Dediu的团队面对着相称大的挑衅。天下上有超越7000种差别的言语,它们之间的接洽十分少。这乃至扩大到信息怎样用笔墨编码的基础器量。比方,差别言语中每个单词的音节数目差异很大,这象征着香农信息率也差别。但是,Dediu和他的团队很有远见,不只斟酌了单词,也斟酌了单词的应用频次。Dediu和他的共事应用了来自欧洲和亚洲17种差别言语的170名成年人的灌音。每位报告者的义务是浏览一组15个大段的文本,大概由24万个音节构成。一秒钟有几个音节?研讨职员抉择音节作为他们独一的信息单元,这是基于在别的两种抉择上采纳的: 音素:关心咱们辨别单个单词的声响单元,被消除在外,由于德迪欧的团队认识到,它们在发言中很轻易被省略 辞汇:被以为是过于言语特同性,方便于比拟有了数据集和器量尺度以后,迷信家们测验了他们的成果,由此提醒了天下言语之间的一些有味的差别: 英语中有近7000个音节,而日语只要几百个 语速从4.3个音节到每秒9.1个音节不等 元音协调(一种惹人入胜的言语翻新,请求后缀与所衔接的单词坚持“协调”)呈现在四种言语中简而言之,这些言语听起来完整差别。只管如斯,Dediu的团队留神到,斟酌到书面文本的语速和信息密度,全部记载的言语信息率基础分歧;信息丰盛的文本浏览速率较慢,而信息较少的言语浏览速率更快。言语就像姜饼人和驯鹿:这两个B/W版本应用差别的辨别率和灰度级别,但编码的信息雷同,就像言语交流差别的战略,但一样无效。材料起源:丹·德迪欧,里昂第二大学。研讨职员断定了一个数字——39.15位/秒,作为17种言语的均匀信息率,这就又引出一些有味的发觉,比方,女性报告者的报告和信息率较低。研讨小组发觉,书面文本的差别对信息率简直没有影响,这标明研讨成果能够推行到本文基于文本的研讨以外。语音速度和音节数的变更显明大于信息速度,信息速度是无效的跨言语衔接手腕。这对咱们的大脑象征着甚么?研讨职员以为,这一发觉象征着信息率必需稳固在一个较紧的均匀值邻近,由于太高的信息率会妨碍大脑处置数据和清楚表白言语的才能;另一方面,低信息率请求大脑在提取意义之前记着太多的单词。这凸起了言语的两重脚色, Dediu总结道:“就犹如硬币的两面性,谈及言语也有两面性,一个是文明上,一个是生物性的,当说一门言语的信息变得愈加麋集,谈话者也会开端加快语速。”相干报导:https://www.technologynetworks.com/neuroscience/news/different-tongue-same-information-17-language-study-reveals-how-we-all-communicate-at-a-similar-323584【本文是51CTO专栏机构大数据文摘的原创译文,微信大众号“大数据文摘(id: BigDataDigest)”】

版权信息Copyright © 银河官网 版权所有    ICP备案编号:鲁ICP备09013610号