翻译神器:“滚动翻译”的知识在哪里?这个小玩意怎么用?

喂?喂???こんにちは?

请问你的朋友懂这些语言吗?恐怕大部分人都得用翻译工具才能全部看懂!

人们住在不同的地方,使用不同的语言。正是翻译的出现,使得跨地域、跨语言的交流成为可能。为了方便交流,翻译工具不断升级,翻译功能越来越强大,从逐字翻译到网站、图片甚至文档翻译。

因此,为了提供更智能、更贴心的翻译服务,让每个人都能与更广阔的世界交流,华为EMUI相继推出了语音翻译、AR翻译、全屏翻译。这一次,华为的长文翻译黑科技——滚动翻译也登场了!

全屏翻译不够,滚动翻译万里挑一。

是不是经常遇到这样的情况:写论文的时候外文参考文献很大?出国旅游,外语攻略傻眼吗?想追到一个国外热点,却发现根本看不懂新闻?

如果要翻译多屏内容,需要反复做全屏翻译。随着内容长度的增加,操作的复杂度也会降低阅读的连贯性。面对这样的场景,全屏翻译变得“力不从心”。这时候就需要滚动翻译来帮忙了!

卷轴翻译支持多种应用、十种语言、多屏内容的翻译。使用小I语音密码“帮我翻译屏幕”或两指按住屏幕,点击“全屏翻译>;卷轴翻译”,就可以开始你的“卷轴翻译”之旅了!

接下来,我们来看看滚动翻译是如何完成长文章翻译的!

精彩流水线:文字→图片→翻译

当你浏览一篇长文章,需要翻译时,系统会先进行截图,形成原文的长截图,然后对长截图进行剪切、检测、翻译、排序、复制、拼接,最后以同样的图片和翻译后的文字再次呈现给你,这就是所谓的滚动翻译。

在这一系列步骤中,最关键的是如何对长截图进行初步处理。那用什么技术来处理呢?这里不得不提一下关键技术——OCR技术。

问题是,OCR在哪里?

OCR,即光学字符识别,是指对字符进行检查、检测和识别,然后将其形状转换为计算机字符的过程。这里的应用是对原始长文章形成的长截图上的字符进行识别和提取,提供给后续的机器翻译,即完成长源字符的提取过程。

在技术上,它是一个检测和识别的两阶段算法框架,涉及中文、英文、日文、韩文、俄文、西班牙文、法文、德文、意大利文和葡萄牙文的识别能力,并包括运行在NPU(神经网络处理单元)中的多个深度模型。

OCR算法被调用后,首先对图像进行增强,图像适应理想状态后,通过多线程同步运行深度模型和后处理操作,最后通过NLU(natural language understanding)对输出的文本识别结果进行校正。

翻译准确与否,取决于OCR识别的准确性;翻译的快慢取决于OCR处理字符的速度。对经过OCR处理的文字进行机器翻译,对图片进行重新排序和拼接,最后将翻译好的长文呈现给用户。

这种创新方案可以将长篇文章中的文字转化为图片,然后转化为翻译,目前已经申请了专利保护。

每个字每个图都要完整。

在滚动翻译中,创新性地使用OCR文本行定位实现图像智能分割拼接,巧妙避免了长截图分割时文本或图像被截断的情况。

你可能会有这样的疑问,原文形成的长截图不能直接翻译吗?为什么一定要做细分?

这是因为目前的图片翻译只支持单屏内容的翻译,长截图会自动缩放到和屏幕一样的高度进行翻译,图片会被压缩,文字大小自然也会被压缩,这就大大影响了翻译结果的准确性。

为了有效提高翻译的准确性,在翻译之前,把长截图剪成几个短图片。但是,如果只是简单地按照屏幕高度来分割一个长截图,很可能会截断一行文字或者一个插图。

在滚动翻译中,OCR技术可以检测一行文本或一幅图片的位置坐标。如果发现分割位置在一行或一幅图片的中间,它将向上移动到行与行之间的空白位置进行分割。

按此规则处理的图片宽度与屏幕相同,高度等于或略低于屏幕高度,每行文字、每张图片都是完整的。这个方案巧妙实用,在快速的同时保证了大家的翻译体验。

目前华为手机EMUI10版本可以体验!系统自动滚动形成长截图进行翻译,方便快捷,真正做到所见即译,滚动全文。