您的位置:首页 > 其它

往届项目回顾:自动字幕对轴软件Autosub

2014-09-01 23:31 162 查看
  为了对ASE的团队项目拥有更加深刻的理解,并吸收往届师兄师姐在进行项目过程中的经验,我们组的成员根据我们的自己的兴趣,在以往师兄师姐的项目中选择了2012年课程中的Msra-Ustc-灰太狼http://www.cnblogs.com/bigbadwolf/)团队进行项目回顾。通过详细阅读他们在blog中的文章,以及与团队师兄当面交流的形式,深入了解了该团队项目的目标、流程、成品、总结,感觉收益颇丰。经过我们组内的会议讨论,互相交换心得,得到以下回顾总结:

  (1)定题

  好的开始是成功的一半,该项目的定题十分漂亮。


  字幕组内部有很明确的分工。 有专门负责翻译工作的人员,但是很少被人知道的是做字幕对轴工作的组员们。因为翻译出来之后仅仅是文本的内容,并没有跟视频文件进行匹配,字幕组的成员们往往需要进行非常细致的比对调整,才能使得最终观众们欣赏到拥有高质量的翻译内容,并且与原视频内容配合得天衣无缝的字幕。遗憾的是对于字幕的对轴工作会占用字幕组成员非常多的时间,而且这件事情相比翻译实在是没有什么技术含量,对于字幕组这些无偿造福人类的同学们来说花费正常的学习生活时间做轴是非常不值当的。我觉得如果有这样一个自动给字幕对轴的软件会给字幕组带来很大的方便。大大提高字幕组的生产效率,让广大美剧、动漫迷们更早的看到期待的作品。

——摘自Msra-Ustc-灰太狼blog


  作为定题最为重要的一部分,用户需求非常重要,自动字幕对轴项目的提出基于师兄师姐来自平时生活中的实际需求(大量字幕需求),同时准确地在制作字幕过程中总结出费时单调重复的步骤——字幕对轴,如此一来贴近生活的市场需求自然不言而喻。

  有了市场需求,就已经是相当有意义的选题,同时该项目还具有可实现性、有益处、竞争压力小,具有成为成功软件项目的必备条件。

  (2)功能设计

  完成定题之后,该团队进行了功能设计,从最后实现的功能来看,较好的实现了大部分功能,并进行了更深层的尝试。


  1、完成基本的播放器的功能,能够加载视频播放,开始,暂停,快进,调节音量等,使满足翻译人员对视频的基本播放需求。(priority: High)

  2、自动的分割出视频中说话的时间区间,将声音的时间轴给切割开来。(Priority: High)

  3、能够加载字幕,将一句翻译好的文本输入到软件中,对应到生成的时间轴上,并且能够显示在屏幕上。(Priority: High)

  4、对于全部翻译完成之后,可以生成相应的字幕文件格式。(Priority: Medium)

  5、能够对视频的声音生成相应的频谱并且显示在软件中的显示屏上来。(Priority: Medium)

  6、可以指定一句翻译好的语句,根据算法生成的其起始的时间,显示其频谱,并且能够手动来改变和调整其对应该时间区间来进行修正。(Priority: Medium)

  7、编辑生成不同的字幕文件风格与格式。(Priority: Low)

  8、编辑字幕在视频上显示的不同风格与格式。(Priority: Low)

  9、 将无字幕的视频生成内嵌字幕的视频文件。(Priority: Low)

——摘自Msra-Ustc-灰太狼blog


  在功能设计上,较为全面细化,而且在各个功能上明确地标记除了优先级,规划合理,目的明确。由浅入深,为后期的项目开展起到了较好的知道作用,最后能够较有条理的实现这些功能,前期合理的规划功不可没。

  (3)UI设计

  在项目的早期,该团队即设计了草图进行UI设计。该团队UI设计并不局限于界面外观的设计,同时根据功能目标对UI各个模块功能进行了详述,对后期模块接口的定义有很大的帮助。







——摘自Msra-Ustc-灰太狼blog


  上一图为团队在最初设计的UI,上二图为最后实现的2.0release版的UI界面,可以看出,最后的界面并不是那么美观,这也是该项目的遗憾。另外最终的界面和最初设计的界面相差甚远,不过两者的各模块定义及其功能基本一致,说明在最初UI界面设计中,UI模块功能接口的设计最为重要,对后期开发有指导性的意义,而具体的摆放位置则不甚重要,可以在后期为了美观与交互方便再行更改。

  该项目最终各模块功能定义如下:


Function:

播放器:1、支持多种视频的播放

    2、实时的加载Autosub软件产生的字幕

    3、显示后台字幕生成的进度



字幕编辑器:1、调整字幕起始时间

      2、人为改变字幕内容

      3、增加或者删除字幕

      4、与频谱同步



频谱窗口:1、与视频同步

     2、调整缩放比例

     3、帮助调整起始时间



——摘自Msra-Ustc-灰太狼blog


  可以看出,各模块分工明确,交互友好,除了不太美观之外,UI设计的思路十分清晰。

  (4)成员分工

  从该项目计划阶段来看,成员分工并不是十分理想。


Task Distribution

Task

Person

Core voice division algorithm

Junyuan Xie

UI design

Liangjun Song

Display the frequency spectrum

Yishi Xing

Media player function

Tao Wu

PM and get the video data for test

Jun Xu

——摘自Msra-Ustc-灰太狼blog


  该团队有5名成员,各成员的分工太过粗糙,在每个人的分工上并没有细致地考虑到每个人可能遇到的问题、需要实现的模块、需要学习的方法,也没有大致地进行不同阶段地分工,只是草草地将Core, UI, Spectrum Display, Media Play, PM分给五个人,并没能做到将工作量平衡分配,也没能做到针对性的将擅长的任务按各成员能力进行分配。

  总体来说,我认为该团队的分功计划太过粗糙,将严重拖慢项目的具体实施。

  (5)更多思考

  从最后的demo来看,我们认为该项目最后存在以下几个问题:

语音翻译部分采用google api;

界面操作太过复杂,作为以自动化为目标的软件,用户体验较差;

界面设计并不美观,细节实现十分粗糙;

最终版本对部分视频格式并不具有兼容性;

软件并没有进行后续跟进。

  通过本次对过往项目的回顾和组内互相讨论,我们深入了解了ASE课程中团队项目的具体过程,和该过程中较为重要的因素,同时在评价师兄项目的过程中,明白项目过程中容易引起错误的过程,避免我们犯一些本可避免的错误;明白项目中的亮点,为我们接下来的选题、实现提供大量指导性的意见。相信在吸取了过往项目的经验之后,我们一定可以在我们自己即将开始的项目中,获得新奇的体验、知识的丰富、能力的提升,并最终收获属于我们的软件!~
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐