> 影视 >

金发傲娇?粉发病娇?日本动画发色与性格关联之量化分析

时间:2023-02-13 09:31:51       来源:哔哩哔哩
金发傲娇?粉发病娇?日本动画发色与性格关联之量化分析

本文系屋顶年度征稿活动·拾荒战略2022后夜祭获奖稿件

摘要


(资料图片)

在日本动画中,发色与性格从一般角度考虑,通常应该是互相独立的关系。然而在圈内,确又能看到诸如“金发傲娇”与“粉发病娇”之类的绑定关系。本文先使用词频统计法与网络分析法,对发色与萌点关键词共现的宏观情况进行统一分析,但该方法存在一定的问题。本文接着使用 TF-IDF 算法,对发色与性格之间关键性的关系,分别从观众角度与创作者角度,进行进一步数据处理与集合分析。根据分析结果,“金发傲娇”等多数处于互为重要词的绑定关系确实存在,这可能与创作者和观众互相反馈,不断强化组合的频度相关。但部分如 “粉发病娇”的则并不在强关系之列。该组合出现的原因,可能与个别之前塑造过的成功角色有密不可分的关系,同时也可能与色彩心理学有一定关系。

关键词:日本动画;词频分析;网络分析;文本分析;关键词共现

1.绪论

发色,作为动画中标识角色的方法,在日本动画界被广泛使用。可以理解的是,特别是 在登场人物较多的动画中,记住每个角色的名字,是非常困难的事情。而发色这种显著的外 貌特征很好地解决了,在对某部作品的角色还不是很熟的情况下,记忆某个角色并与其它同 好交流的障碍——例如,在《Lycoris Recoil》中,由于真岛露脸时间较少,大家很容易记不住真岛的名字,但绿色的头发非常显眼,且在本作中并没有出现其它绿发角色,所以交流时 很容易被称为“绿毛”而并不会出现交流沟通的障碍。

所以,动画人物的发色从动画故事创作本身的角度出发,我们可能天然地会认为,发色, 这种外貌特征,应该是在某部动画中“独特”、“随机”,互相独立的存在的。也就是说,发色本身与某个角色的性格之间,应该是不存在关联的。毕竟,对于传统认为的拟像数据库而言, 发色与性格,应该都是“随机取样”出来的。

然而存在矛盾的是,在动画圈观众内长期流传着如“金发傲娇”,“粉发病娇”等发色与性格进行关联的“刻板印象”的说法——以“金发傲娇”举例,从观众的视角来看,“金发”的角色很有可能具有“傲娇”的性格;而反过来“傲娇”这个性格,也很有可能出在“金发”的角色身上。这也意味着,某些发色与某些性格之间,应该拥有较强的绑定关系的,并非完全随机。

那么,日本动画中的角色的发色与性格之间,究竟是否是存在关联的呢?如果存在关联,那么背后的机制如何?如果不存在关联,那么为什么会存在关联性的说法?本文将通过量化 分析,对这些问题进行解答。

2.数据来源与数据说明

本文以萌娘百科作为数据来源,通过 python 爬取了 2000 年至 2021 年共 2145 部日本动画,共 17353 人次角色。爬取规则如下:①该动画链接有效;②该角色链接有效;③一部动画在一年出品两季及以上且主要角色未发生变动,仅当作一季进行统计。

在完成对角色的爬取后,进一步对每个角色存在的发色、瞳色与萌点数据进行爬取收集, 并对数据进行初步筛选清理。筛选规则如下:①该角色拥有独立词条,且唯一指定;②该角色拥有发色数据(如有两种及以上的发色,则以前两种进行收集)或拥有瞳色数据(如有两种以上的瞳色,则以前两种进行收集);③该角色拥有有效萌点。

由于萌娘百科的链接存在重定向现象,因此需要对萌点进行统一化处理,且需要删除单纯的发色或瞳色萌点。另外,本文重点关注发色特征,因此只筛选拥有发色特征的角色(光头由于缺乏发色信息,同样被删除)。经过再次清理后,最终研究样本包含 2000 年至 2021 年,1325 部日本动画,共 13307 人次角色;涉及 13 种发色,2145 种萌点(含性格、外貌、身份等)。

3.网络与频次方法

3.1频次统计与网络构建

本文关注的是发色与萌点中性格之间的关系。因此,先以发色作为 I 类节点,以萌点作为 II 类节点,之间建立共词关系链接,并统计各类节点出现的频次。需要注意的是,本文不对同类节点的共词关系构建链接。频次统计结果见表 1。

从频次信息之中,我们可以看出,发色的统计结果差距巨大。黑发角色出现频次远远高 于棕发与金发角色,而棕发与金发角色频次又远远高于其它发色。而彩虹发与透明发非常罕 见,出现频次极低。而萌点统计频次差距则相对比较平滑。

进一步地,我们对绑定关系出现的频次进行统计,统计结果见表 2。

根据发色与萌点之间的共词词频,可以构造图 1 的网络图。由于关系较为复杂,且本文仅关注绑定最深的节点关系,因此仅使用 TOP1 算法对共词网络图进行处理。共词网络图见图 1。

其中,红色节点为发色节点,蓝色节点为萌点节点;而中心度越大的节点,其面积在图 中也越大。从图中可以看出非常明显的社群化现象,并且发色出现频次越高,与其相连的萌 点节点也越多,呈现出正相关的关系。而某些发色与萌点之间,存在双向链接的关系,即互 相都是共现最多的关系。从宏观网络角度来看,可以说明,某些发色与某些萌点之间,确实 存在一定的绑定关系。

3.2频次统计的局限性

尽管频次统计方法,对于研究共词关系而言,拥有简单明了的优点。但从 3.1 的统计结果来看,仍然存在一些问题。

首先,对比表 1 与表 2,可以发现,黑发、棕发、金发由于词频数较高,导致在发色与萌点共现时,这三种发色与其它萌点之间的链接频次也相对较高,占据了 TOP10;而非这三种发色的共现组合,排序直到 TOP40 时才第一次出现。而同样,巨乳、短发、傲娇也在TOP10 中上榜了。

其次,表 1 中,例如黑发-巨乳关系(331 次)与棕发-巨乳关系(317 次)进行对比。从频次来看,黑发的绑定关系比棕发强。然而,黑发出现的频次大约是棕发的 138%,却在这两对链接上只高出了大约 4%。这似乎并不能说明在该萌点上的重要性更强。而相反,黑长直与金发碧眼两个萌点的频次虽然不高,却拥有非常高的共现词关系。总之,会陷入“强节点”与“弱关系”以及“弱节点”与“强关系”之间需要平衡的困境中。

最后,从网络图上可以发现,有些萌点节点会与两个发色节点发生链接。换句话说,对 该节点而言,A 节点拥有最高频的共现关系;但同时,对 B 节点而言,该节点却又是 B 节点最高频的共现词。那么同样会陷入到上文中取舍的矛盾。总而言之,频次统计并非是较为合适的共词衡量方法,结果会受到频次本身的干扰。

4.TF-IDF 特征提取算法

4.1TF-IDF 简介

齐普夫定律提出,一个词的词频与其排名成反比。这说明,正如本文在第 3 章提出的词频统计的局限性,高频词并不一定是关键词。为了能够更好地提取关键词,本文引用文本分 析领域常用算法 TF-IDF。其中,TF 指词频,而 IDF 指逆文档频率。IDF 表明,包含某个词的文件数越少,该词就能更好地区分类别,IDF 值越大。TF-IDF 计算公式如下:

4.2数据筛选

根据第 3 章的频次统计,本文删除掉部分不重要的节点,以简化分析流程。发色词删除频次较少的彩虹发与透明发节点,剩余 11 个;萌点词删除频数低于 100 的节点,剩余 222个。

4.3发色对应性格 TF-IDF

以发色作为条件,对于共词的萌点的 TF-IDF 值进行运算。保留了性格有关的萌点后,TOP10 排名如图 2:

以发色为条件进行计算,是在模拟观众看到角色的发色后,对于该角色可能出现的性格 的重要性进行排序的过程。经过 TF-IDF 值提取后,部分萌点的重要性被突出了。比如在白发角色中,狂气性格的重要性超过了 0.1;而在词频统计时,白发和狂气的词频都较低。又比如一些发色可以看出一定的刻板印象,比如银发角色,就偏向于三无冰冷一般的性格;而 红发角色的性格,又偏向于充满活力。

但同样可以发现,例如傲娇与元气性格萌点,尽管在各发色上的 TF-IDF 值有所差异, 但由于本身的频数较高,因此对于多数发色而言,都处在较为重要的位置。因此,只根据发色条件筛选性格,解释力略有欠缺。

4.4性格对应发色

接下来从创作者视角进行分析,即根据角色的设定性格,为其赋予发色的过程。以性格 萌点作为条件,对于共词的发色的 TF-IDF 值进行运算。由于性格萌点较多,仅筛选第一发色与第二发色的 TF-IDF 差值在 0.05 以上,即第一发色显著突出的性格萌点进行分析。TOP5 排名见图 3,图 3 的颜色代表该性格下最关键的发色。

从创作者角度,如果只关注 TOP1 的性格对应发色节点,那么可以进一步看出在 4.3 中发现的刻板印象,例如棕发的“傻白甜”特征等。

但同样,若只使用性格条件来筛选发色节点,仍然缺少一定的解释力。

4.5交叉分析

为了更好地确立绑定关系,本文将 4.3 与 4.4 中的排名进行交叉,交叉结果如表 3。为了简化结果,性格对应发色仅提取 TOP2 的特征。

根据交叉结果可以看出,存在交集的共词组,与平常圈内传播的刻板印象拥有较强的重 合度。其中,本文开头所提到的“金发傲娇”,就处在两者的交集处,证明了“金发傲娇”这对 组合确实存在强绑定的关系。但“粉发病娇”的组合却并不存在于两个集合的并集之中。

5.原因剖析总结

5.1“金发傲娇”类的原因

根据上文分析,可以得知日本动画角色发色与角色具有的性格(萌点)之间存在一定相 关性,这一结果基本与动画圈内多年来的直觉感受相印证。接下来,本文将先探讨出现这种 相关性的原因。

首先,不可否认的是,发色和人物的萌点数量是相对有限的。穷尽过去近半个多世纪的 动画创作,我们很难轻易地说,还有什么发色与萌点之间的搭配是从来没有出现过的。根据东浩纪的“数据库”理论,如今的角色创造基本都是在要素的数据库中,提取需要的各项数据 进行拼凑组成的;而常见的发色与热门的性格(萌点)相对总量来说更是少之又少,因此不 可避免地出现一些圈内刻板印象中的常见组合。

角色创造过程中要素拼凑这一特点,在如今的动画领域变得越发普遍,而这背后反映了 两个问题。一方面,是消费社会背景下动画尤其是商业动画的量产需求。为了追求产出,创 作者不可能为每个角色花费大量精力去塑造,但又不能让角色过于平淡以至于无法给观众留 下印象,因此,加入一些萌点成为一举两得的解决方法。这样,创作者就能在短时间内产出 大量看起来不那么同质化的角色。另一方面,为这些单一作品中各有特色、而整体上却同质 化严重的角色买单的观众,存在快餐化消费的现象。由于当前快节奏的生活,人们难以沉下 心来认真观看作为“艺术品”的动画,更多需要的是作为“快餐”的作品,需要的就是让人应接 不暇的视觉冲击——比起角色背后的故事,多数观众或许更青睐短时间内就能展现出的角色 外貌与言行举止中表现出的萌点。在这种创作者和观众都愿意接受的情况下,数据库化角色 创造就更加不可避免了。在将来,或许会出现更多不同萌点间的搭配组合。

在确认这种相关性的前提下,我们可以进一步讨论为什么会出现“金发傲娇”这样的固定 搭配泛滥的状况了。本文认为,起因是出于偶然的设计出一个角色,由于作品大获成功使得 角色给观众以及其他创作者带来深刻印象。由于难以考据源头,本文暂时以校园迷糊大王中 的泽近爱理为例。在后来的创作者印象中,提到此类属性角色时就会想到泽近爱理,可能潜 意识中就会为傲娇的角色添加上相似的属性,比如金发、双马尾等。这里尝试用心理学上“自 我实现的预言”的现象来解释。由于某一个过于成功的角色存在,后来的创作者们的潜意识中就产生了这个角色与其相关属性的关联。同时,心智会自动过滤掉一些其他不符合这一关 联的信息,例如从实证分析中可以看出,金发同样与残念系、败犬等属性也具有较高的相关 性;而黑发、棕发的角色中具有傲娇属性的也不少。创作者们通过把更多注意力放在了符合 这一关联的角色身上,诞生了例如后来的三千院凪、秋月爱莉、泽村英梨梨等,借由这些角 色,金发傲娇(双马尾)的组合得到了强化。

如此可行还有一个前提,就是商业上消费者要接受,事实证明消费者完全吃这一套。由于珠玉在前,消费者看到一个相似的角色时可能更愿意去尝试一下——比如之前流传的“中国人都是白毛控”这个说法。这一解释同样可以运用到观众身上,由于不断有新角色出现, 能留在观众印象中并能第一时间回忆起的必然也是最著名的个别角色。在回想某个属性时, 通过某个著名角色自然而然地将这个属性与这个角色拥有的其他属性产生了关联,从而产生心理暗示,似乎这些属性就是这样搭配的。在之后又看到其他同样具备这两三样属性的角色时就会加深这一印象,而偶尔看到不符合的角色也不会影响这一印象的正确性,最终大家就 都形成了金发与傲娇、双马尾等属性绑定的刻板印象。

5.2“粉发病娇”类的原因

不过也有观众集体印象出现“偏误”的时候,例如粉发和病娇的关系。近十年,观众中时常有粉发和病娇属性的绑定的印象。但从上文分析结果来看,对于粉发角色而言,不仅总体词频较低,元气、天然呆等萌点,也相较病娇重要性更高。这可能也和上文提到的原因相同,可能是受到某个非常成功的角色影响较大。本文推测为《未来日记》中的我妻由乃。当时由于我妻由乃这一角色塑造的成功使得病娇这一相对小众的属性深入人心,表情包模因在圈内大量传播——我妻由乃几乎成了病娇的代名词,而这顺带使得粉发也与病娇产生了关联。诚然,之后也出现了如松坂砂糖、木更等符合粉发病娇条件的角色加强观众的这一印象,但从数据来看并不显著。

另外,从上文的发色与性格之间的关联中,还能看到一点色彩心理学的影子。例如,银色给人一种冰冷的感觉,因此这与三无给人冷淡的感觉一致;再比如红发给人一种热情如火的感觉,因此红发的性格也多为充满活力。同样的,粉色给人的感觉则多为可爱,从重要的性格来看也确实多为可爱的性格。但粉发也有腹黑的重要性格(“粉切黑”的说法),以及本文所说的“粉发病娇”。其目的恰恰应该是制造反差萌,利用粉发的可爱,来衬托背后的黑暗, 一方面在反差变动时,可以为观众创造一种惊讶的感觉,另一方面可以让人物的设计更为立体。因此,“粉发病娇”的这种独特的,如同被欺骗了一般的反差感,让该组合流传开来了。

但若是要制作这种反差,对于剧情与角色的设计是一个巨大的考验,处理不好会很容易让观众对于该角色产生厌恶。所以病娇性格,在角色创作上,并不是一种常用的萌点。在此基础上,若是能为病娇创作一个优秀的故事,粉发反而并不是一种必要特征了,就算是黑发、 棕发等常见发色,都同样能塑造好该角色。

综上所述,我们可以发现发色与属性之间存在两种形式的关联。一是实际存在的,创作 者在创作时会有意如此选择的,观众中也有同样认知的联系,形成了双向的认知。二是单方面的,即在观众群体中产生的错觉,创作者群体在创作角色时并未明显体现出选择倾向的联系。

精彩推送