您的位置:首页 > 其它

分析周杰伦75775字歌词后,我们用他最爱的词重写了《说好不哭》

2019-09-22 12:36 573 查看

大数据文摘授权转载自RUC新闻坊


9月16日23点,鸽王杰伦终于上线了新歌《说好不哭》,但听着听着,对《说好不哭》的评价就开始两极化了起来。


有人觉得,听着这首歌,仿佛自己的青春岁月回来了,说好不哭,可还是哭了下来,那个周杰伦又回来了!


也有人觉得,《说好不哭》中规中矩,并没有什么新意,曾经的周杰伦已经变了。


那么,变的到底是周杰伦,还是我们?


为此,RUC新闻坊小编梳理了周杰伦出道至今发表的19张专辑、6首单曲和3部电影原声带,共计75775字歌词,并记录了相应的豆瓣评分以及QQ音乐评论量。试图通过数据还原这些年周杰伦的歌发生了什么。最后,我们还用周杰伦作品中出现最多的词汇重写了《说好不哭》。快来看看!



快20年了,周氏歌词变了吗?


我们首先分析了周氏歌词的总体特征,发现“爱情”的确是周杰伦歌曲的主旋律。



然后,我们选取了豆瓣评分最高的《范特西》(9.2)以及《Fantasy Plus》(9.2)两张专辑,统计其中的高频词汇,并与新歌《说好不哭》的高频词进行对比。为了准确地分析各专辑高频词的特征,我们采用了TF-IDF算法来统计不同专辑、单曲和原声带歌曲的高频词。(具体处理过程请见文末)。


周杰伦之所以迷人,是因为他唱的不仅仅是“情歌”。


周杰伦的专辑在豆瓣上达到9分以上的共有2张,分别是2001年发布的《范特西》(9.2)与《fantasy plus》(9.2)。对这两张专辑的高频词进行统计,并与《说好不哭》的高频词进行对比,我们试图找出他们之间存在的差异。


从词频来看,《范特西》《Fantasy Plus》的词汇运用上超脱于情爱,主题多变,展现出周杰伦对于世界、历史与自我的奇思妙想。这两张专辑的词语趣味性强,既有“美索不达米亚”“威廉古堡”等不常用的名词,又有“吆嗷”“哼哼哈兮”等口语化词语,极具周杰伦的个人风格。修辞也十分丰富,如比喻手法、情景描写等。《范特西》专辑中出现最高频的词语是“双截棍”。“双截棍”与排名第二的“哈兮”均出自周杰伦的成名曲《双截棍》。“双截棍”一度成为热词,传唱度较高。诸如“哼哼哈兮”“飞檐走壁”等词语迎合旋律反复出现,加深了人们对“周杰伦”的印象刻画。


而专辑《fantasy plus》中的高频词语“一步”“小小的”“重重的”均出自《蜗牛》。积极向上、怀抱梦想,本是略显老套的励志主题,但以蜗牛自喻,却有笨笨的萌态。




《说好不哭》目前豆瓣分数仅5.8分,没有达到6分的及格线。这个分数在周杰伦的历年专辑豆瓣评分中偏低。


与高分专辑相比,《说好不哭》的用词稍显平庸。这是一首讲述成全与约定的情歌,展现了当代年轻人在自由与爱情间的艰难抉择。动词与形容词的运用频率较高,“挽留”“打扰”“放手”“难过”“拼命”等词语,展现出年轻人对于爱情欲语还休的敏感纠结。然而这些词语中具有创意性的词汇较少,鲜有修辞,多为平直叙述,有“口水”之嫌。



也无怪有粉丝会问,从前的那个周杰伦去哪儿了?如果你问一个资深杰迷“入坑”的原因,TA可能会说:


从他的歌里能听到丰富性。爱情是流行音乐最普遍的主题,但从周杰伦各专辑高频词看,他的野心远不止谈论爱情。


《范特西》和《Fantasy Plus》这两张专辑的名称都由“fantasy”(想象)这一单词演变而来,在歌曲创作与立意选择上也展示出周杰伦天马行空的想象力。


地域跨度能从“美索不达米亚平原”“威廉古堡”,到“少林武当”;时间跨度能从西元前、“一九四三”到现代;歌者的身份,时而是挥舞着双截棍的少年,时而是“吆嗷”叫着的忍者,又时而变成背负“重重的壳”的蜗牛。“简简单单”“哼哼哈兮”“飞檐走壁”……少年的跳脱与锐气跃然眼前,仿佛有一百万种方法探索未知、对抗无聊。


行走江湖的少年也有柔软一面。专辑《范特西》高频词中排名第七的“妈妈”一词来自歌曲《爸我回来了》,这首歌表达了对父亲家暴行为的批评,是少年人特有的敏感和恳切,引人深思。


也可能会说,不管其他题材,周董的情歌就是能唱出人心的曲折。


周杰伦对爱情的讨论,同样具有十足的丰富性。有网友说,周杰伦的歌能承包一段恋爱里能经历的全部心情。“暗恋时《等你下课》,热恋时《告白气球》,分手时《不爱我就拉倒》分手后《说好不哭》,杰伦果然还是那个最懂青春的人。


在2000年发行的第一张专辑《Jay》中,“可爱”“面红”“后知后觉”“坏坏”等高频词,可见青春期萌动的心绪。这张主打情歌的处女专,讲述了80一代的恋爱故事,既有“漂亮得让我面红的可爱女人”的直白炽热,也有“一步两步三步四步望着天”的无声曲折。


也可能会说:他的歌里,总有几个词让人听之难忘。


周杰伦有着强大的造词力,范特西,双截棍,发如雪,青花瓷,东风破……字与字的组合碰撞,形成鲜明的符号,甚至会发展成一种文化现象,融入到日常的语境之中。


专辑《范特西》里的高频词“双截棍”和“哈兮”均出自让周杰伦一炮而红的《双截棍》。记忆点鲜明的关键词和朗朗上口的拟声词随着旋律重复出现,江湖快意,浪荡不羁,叫人“上头”不已。专辑《我很忙》问世,《青花瓷》引起了一阵“中国风”,颇具古意的歌词碰撞流行音乐,一句“天青色等烟雨而我在等你”传唱大江南北。


但是通过分析可见,周杰伦歌曲的近期相比早期更频繁地使用直抒胸臆的词汇。


发布于2011年的《惊叹号》豆瓣评分仅有5.6,较以往专辑的评分出现断崖式下跌。这张专辑中卖萌成为王道,“雨伞”“弹琴”“仰天”“公主”“斗志”“毅力”等高频词汇风格单一,音乐主题围绕爱情打转,使听众有些审美疲劳。


而稍近的《周杰伦的床边故事》(2016)延续了的爱情主题,在用词上鲜有突破,依旧走可爱甜蜜的“小公举”路线。拥有“冰淇淋”“土耳其”“故事”高频词汇的《告白气球》成为这张专辑唯一爆火的歌曲,成为当时的ktv必点曲目,但也不乏过于简单直白的批评。


总体而言,从周杰伦各主要专辑的高频歌词可见,早期的周氏歌词更为大胆,融合青春、爱情、家庭、童年、幻想等多种元素,主题丰富,风格搞怪而又富有灵性,在听众中能引起较大共鸣;同时,中国风元素也是周氏歌曲始终的坚持,并在歌颂爱情这一流行歌曲的普遍母题外又探索新的主题表达;而近期的专辑则去除了不同风格的修饰,回归初期简单直白的作词风格,继续讲述着爱情故事。


杰伦已经江郎才尽?


这一部分,我们手动统计了上述19张专辑、6首单曲和3部电影原声带中的作词、作曲、编曲情况,记录其中周杰伦的参与情况的比重。


从中可以发现,周杰伦的参与度一直保持接近50%的平均值,周杰伦在创作中的投入程度并未随着时间变化而出现显著差异。



除了与御用词人方文山合作,周杰伦本人也会参与一些歌曲的作词,但相比于作曲和编曲,他的作词能力受到了更多的争议。


在我们收集的180首歌曲中,有45首由周杰伦作词,约占比25%。在周杰伦发表的首张专辑《Jay》中,《星晴》和《黑色幽默》两首歌均由他本人作词,并广受好评。此后,《安静》《蜗牛》《晴天》等由他作词的歌曲也广为传唱。其中,《梯田》和《稻香》两首歌曲分别获得第15届和第20届金曲奖最佳作词奖的提名。


然而,在周杰伦2018年发表的单曲《不爱我就拉倒》中,他与宋健彰共同创作的“土味歌词”遭到网友的吐槽。有趣的是,虽然这首歌的豆瓣评分下跌到了4.2,在周杰伦的所有作品中位于最后一名,但在QQ音乐的评论区,《不爱我就拉倒》下的评论数达到了246622,是周杰伦在这个平台上评论数量最多的单曲。


尽管之后周杰伦在ins上亲自发文喊话网友听歌不用太认真,但有关“周杰伦是否江郎才尽”一类问题的讨论却愈演愈烈,这在一定程度上反映出一代天王的人气依旧。


此外,在这180首歌曲中,除了电影《功夫熊猫3》的主题曲《Try》,其余179首的作曲都是由周杰伦完成的,作曲质量受到了广大歌迷的认可,也展现了他在音乐上的独特才华。而与作曲相比,周杰伦参与编曲的次数较少,180首歌曲中有26首由他编曲,约占比14.44%。


值得注意的是,在统计的180首作品中,有14首单曲的作词、作曲和编曲都是由周杰伦完成的。尽管周杰伦乐于参与,但是我们顺手做了他的专辑参与度和豆瓣评分的相关关系,发现居然存在-0.3478的弱负相关关系。看来,如果周杰伦对歌曲的创作参与度过高,可能未必会给作品带来更高的口碑。


在这14首单曲中,除《晴天》和《不爱我就拉倒》外的其他12首歌曲均未获得太高的关注度,其在QQ音乐平台的评论数量远低于周杰伦所有歌曲所获评论数的平均值。


《晴天》所引发的强烈情感共鸣使它成为网易云音乐首支评论突破百万的单曲,并一度占据单曲评论榜榜首,而它在QQ音乐平台上的评论数突破了8万,紧跟在周杰伦近年发表的三首单曲之后。在同一平台上,周杰伦2018年发表的单曲《不爱我就拉倒》的评论数远高于他的其他作品,达到了24万多。但是,关注度的高涨并不能简单理解为对周杰伦创作才华的肯定,其中夹杂着听众们赞美、质疑、惋惜等的复杂情绪。


通过观察周杰伦自出道以来的专辑创作情况可以看出,周杰伦在专辑中的参与度有着较多起伏,总体上并未呈现明显的上升或下降趋势,这也与他随性、自由的音乐态度相呼应。在他的所有作品中,周杰伦参与度达到50%及以上的作品包括单曲《不爱我就拉倒》《等你下课》、EP《Fantasy Plus》《大灌篮》和《霍元甲》,以及专辑《叶惠美》《惊叹号》《Jay》《七里香》和《十二新作》。其中,《Jay》《Fantasy Plus》《叶惠美》和《七里香》均超过了8分。


两版歌词,你更爱哪一款?


“黔驴技穷”喊了多少年,新歌却照样热度不减,这是因为在杰迷的心里,周杰伦永远是那个能给人带来惊喜,有点臭屁却又有才的“小公举”啊。最后,我们运用从所有专辑、单曲和电影原声带中分析的高频词top10组成一个新词库,并运用这个新词库重新填了这首《说好不哭》,希望能帮你找到更多记忆里的“杰伦味”。


向上滑动阅览


歌曲原版


没有了联络

后来的生活

我都是听别人说

说你怎么了

说你怎么过

放不下的人是我

人多的时候

就待在角落

就怕别人问起我

你们怎么了

你低着头

护着我连抱怨都没有

电话开始躲

从不对我说

不习惯一个人生活

离开我以后

要我好好过

怕打扰想自由的我

都这个时候

你还在意着

别人是怎么怎么看我的

拼命解释着

不是我的错

是你要走

眼看着你难过

挽留的话却没有说

你会微笑放手

说好不哭让我走

电话开始躲

从不对我说

不习惯一个人生活

离开我以后

要我好好过

怕打扰想自由的我

都这个时候

你还在意着

别人是怎么怎么看我的

拼命解释着

不是我的错

是你要走

眼看着你难过

挽留的话却没有说

你会微笑放手

说好不哭让我走

你什么都没有

却还为我的梦加油

心疼过了多久

还在找理由等我

RUC新闻坊改编版


习惯了寂寞

心碎没结果

深陷入一种难过

回忆太温柔

永恒不停留

曾经美好搁浅角落

离开的时候

就默默泪流

眼看孤独融化我

月光爬满了

伤悲徒留

为什么连道别都没有

骤雨在纷飞

风月惹零碎

怎么会舍得我难过

草木已生灰

微笑到疲惫

深埋下的季节很美

听不见浪漫

背对背分辨

从来是小心小心翼翼的

后知后觉着

总事与愿违

安静面对

褪色的红玫瑰

星星睡着等到天黑

轻轻依偎回味

放你去远走高飞

骤雨在纷飞

风月惹零碎

怎么会舍得我难过

草木已生灰

微笑到疲惫

深埋下的季节很美

听不见浪漫

背对背分辨

从来是小心小心翼翼的

后知后觉着

总事与愿违

安静面对

褪色的红玫瑰

星星睡着等到天黑

轻轻依偎回味

放你去远走高飞

独自一路向北

解药释怀我的伤悲

琴弦上落了灰

等爱乘着风飞回

数据收集与分析:蒋政旭 姜紫荆 杨雅涵 许佳蕊 文露敏 钟愉靖 张文丽

文案:葛书润 杨凯文 

填词:张文丽

图表:邓海滢 蒋政旭 刘建坤 

美编:马冰莹

统筹:方洁


数据说明:


本文所有原始文本材料来自周杰伦出道以来发表的专辑、单曲和电影原声带:

  1. 收集周杰伦自2000年起发表的19张专辑、6首单曲和3部电影原声带中共计75775字的歌词作为原始文本材料,建立语料库。

  2. 使用jieba分词的精确分词模式对语料库文本进行分词。分词结果均已去掉数字、单字、标点符号等。jieba分词https://github.com/fxsjy/jieba/

  3. 在分词基础上,采用TF-IDF加权技术统计每一张专辑相对于语料库的前100-150个高频词;并统计新歌《说好不哭》相对于语料库的前50个高频词,TF-IDF算法认为:如果某个词在一篇文档(新歌or某个专辑)中出现的频率高(即TF高),并且在语料库中其他文档(所有歌曲)中很少出现(即IDF高),则认为这个词具有很好的类别区分能力。

  4. 分析根据:一个词在每个文档中出现的频率越高,它的IDF就越低,表明这个词并不是某一个文档的代表性词语。相反,IDF越高的词语越能代表某个文档的特点,从而根据该关键词可以分析出该文档的风格、特点以及主题等。

  5. “参与度”:我们将歌曲创作均分为作词、作曲、编曲三个环节,参与任一环节即视为参与度为1/3,如一张专辑共10首歌曲,则计算周杰伦参与每首歌曲的创作环节总数,除以专辑10首歌曲的所有创作环节总数,获得参与度的百分比数据。



一个去乌镇的机会!

第六届世界互联网大会•乌镇峰会

数字经济人才专场研讨会


-18日晚-
数字经济人才对接VIP晚宴
首批“30位新生代数字经济人才”颁奖仪式

-19日上午-
大咖主题演讲
《数字经济人才城市指数报告》发布


点击“阅读原文”或扫描海报二维码报名参加👇





实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至zz@bigdatadigest.cn


点「在看」的人都变好看了哦!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: