问答媒体

 找回密码
 立即注册
快捷导航
搜索
热搜: 活动 交友 discuz
查看: 192|回复: 21

百度跟日语是有仇吗?

[复制链接]

1

主题

3

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2023-2-2 08:18:27 | 显示全部楼层 |阅读模式
​​起因

最近遇到一个非常无语的事:
某天,我正悠闲地逛着网站,
突然,屏幕上的东西让我顿时眼(xue)前(ya)一(biao)亮(sheng):



百度百科-平文氏罗马字(现已更正)

乍一看,这好像是日语,毕竟后面括号里面都还有假名标注,更何况这本来就是与日语有关的词条;
但仔细一看:这日语汉字怎么用的是简体?
为什么日语不能用简体

历史上,使用过汉字的语言有汉语、日语、朝鲜语(韩语)、越南语,
其中,在20世纪中叶时,朝鲜语、越南语的使用国都大面积地废除了汉字,所以目前能在网络上看见的汉字就基本都是大陆、新加坡等使用的简体中文,以及港澳台使用的繁体中文,
还有就是日本使用的汉字。
日语汉字原本和繁体汉字是一样的写法,但1946年,日本政府公布了『当用漢字表』,规定了部分汉字的新字形,于此日语就开始有了简体字。
这些简体字有些和大陆的简体字是一样的:
「党」、「学」
有些简化了但没完全简化:(以下从左到右依次为:繁体、简体、日语)
覺 觉 覚
彈 弹 弾
有些简化得比大陆简体还简:
櫻 樱 桜
圖 图 図
由此,日语形成了一套既不同于繁中,又不同于简中的汉字系统。
简而言之,日语汉字用简体中文系统的汉字,大概就相当于这样显示简体中文:



十六夜咲夜,但是日语字体

百度百科绝对跟日语有仇

所以,像往常一样,我还是决定不嫌麻烦编辑一下。因为我早就有很多次编辑这种词条的经验了。
但是,万万没想到的是,这次居然被退回了……



百度百科编辑被退回

退回原因分析

编辑日语被退回这种事倒是不少见,早期我被退回词条大多都是因为编辑日语。
如果说退回理由真是审核人员给出的,那就太滑稽了。编辑的内容本来就是日语的例子,如果说百度百科里真的不让出现外文/古文,那么百度百科上的那些英语单词的词条下的例句肯定也是不合法的了。实际上,这个退回理由本来是用来针对那些直接把大段的外语介绍搬运到百度百科上的,对于这种作为说明对象的外语原文是不适用的。
所以审核员真正退回的原因实际上是他们错误地把日语辨识成了繁体字(这也是早期我编辑日语词条被退回的原因)。
再看一下申诉回复,看来审核员居然认为这是一个中文词条……他所说的“简体文字”很明显是相对于“繁体文字”而言的,也就是说,审核员还是认为那些字是介绍文字,而不是日语原文。



百度百科申诉历史

听我说谢谢你
结局

最终,在我坚(si)持(pi)不(lai)懈(lian)的十次申诉后,词条终于通过了……




申诉成功

侃一侃百度对日语的态度
不止百度百科,百度的所有产品对日语的支持都差得要命!
百度百科的汉字自动简化系统在我反馈后应该就被废止了,但是留下了大量的非繁非简非日文的日语。



反馈历史

并且,强制简化系统至今仍在百度知道存在。



百度知道上面的日语汉字被强制简化

要不要把百度翻译里面的日语汉字也给简化了呢?
日语字体问题

日语是要用日语字体显示的,这一点百度似乎没有一个产品做到了这一点。
汉字虽然是同一个字,但是在不同地区,写法有时会有差别。但是电脑(至少20世纪的是)可没有那么多空间来为每一个写法分配不同的键位,于是就将大部分汉字放到一个键位里。
比如“户”字的第一笔,大陆一般写成丶(点),港澳台一般写成丿(撇),而日本一般写成一(横):



户戶戸

当这些部首单独成字时,还可能为每个写法单独分配键位;不过当加上偏旁组成字后,如果还是为每个写法分配一个键位,那万国码可能要爆炸……
最终,这些字就放在了同一个键位,而不同的字形使用字体区分。所以更换字体以后,这些汉字的写法就差了很多(以下是六个汉字在不同字体下的显示情况,其中“户戶戸”是不同写法分配了不同键位的,而“戻房沪”都是不同写法合并分配到了一个键位上)



简繁日字体差别

​大陆的标准字体是宋体(SimSun)
港澳台的默认字体是细明体(MingLiU)
日本的默认字体则是游明朝(Yu Mincho)
所以,即使是同一个键位,其写法可能是不同的。
简中和繁中字体虽然有区别,但是由于都是中文,只是地区不同,行政机构规定的标准写法不同而已,所以无论用哪种字体基本没什么区别,也可以理解为政治因素导致的写法不同;
但是中文和日语字体的区别就完全不同了。毕竟是两门不同的语言,有一些字写法差别就非常大。



中日字形差别

简而言之,当显示日语时,就不能使用简体字体,否则就会出错。
也就是说,百度翻译的日语严格来说就是错的:



百度翻译

微软必应翻译(中国大陆)也是:



微软必应翻译(真·海·内存·知己)

有道翻译也没能幸免:



有道翻译(梅开二度)

这一点谷歌翻译就做得很好,虽然说谷歌翻译现在退出中国大陆了(悲)
而萌娘百科也为了能够正确显示日语而专门为日语提供了标记:



萌娘百科对于日语的支持

总结
虽说懂点日语的人毕竟很少,所以看出这里日语显示是错的人也很少,所以就连审核者都没搞懂,还以为这里不能用“繁体”,但是,大多数人以为是对的并不一定代表着那一定就是真相。而百度,号称是全球最大的中文搜索引擎,如果其上的日语显示都是错误的话,那就会有一些人被误导,认为日语里面用的汉字和简体中文是一样的。所以,百度有责任起好示范作用,正确地显示日语,防止对公众造成误导。​​​​
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-2-2 08:19:11 | 显示全部楼层
很多字形问题是unicode的锅,把不少中日字形差异较大的汉字分配到一个码位了
回复

使用道具 举报

2

主题

4

帖子

8

积分

新手上路

Rank: 1

积分
8
发表于 2023-2-2 08:19:19 | 显示全部楼层
你居然指望百度把日文支持做好,你看百度搜索日文词带假名根本不能看,还不如网易云音乐搜日文歌名[doge]
回复

使用道具 举报

1

主题

5

帖子

4

积分

新手上路

Rank: 1

积分
4
发表于 2023-2-2 08:19:25 | 显示全部楼层
百度只是觉得中国人不需要能够正常显示和使用日语,百度日本就没这些问题。之前有搜索,搜索死了之后又弄了个simeji。再就是国内很多平台对日语的支持都很烂,不能正确调用日语字体,不过没强行开简繁转换就不错了
回复

使用道具 举报

1

主题

4

帖子

5

积分

新手上路

Rank: 1

积分
5
发表于 2023-2-2 08:19:50 | 显示全部楼层
メモリ?不是内存条的意思吗?必应翻译在“海内存知己”这句话上面老不正经了[飙泪笑]
回复

使用道具 举报

3

主题

8

帖子

14

积分

新手上路

Rank: 1

积分
14
发表于 2023-2-2 08:20:22 | 显示全部楼层
也有前端lang属性的问题吧[思考]
回复

使用道具 举报

0

主题

6

帖子

10

积分

新手上路

Rank: 1

积分
10
发表于 2023-2-2 08:21:21 | 显示全部楼层
但lang属性似乎是对全局有效的
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-2-2 08:21:27 | 显示全部楼层
萌娘百科上看见的:https://zh.moegirl.org.cn/%E5%BE%AE%E8%BD%AF%E5%BC%8F%E4%B8%AD%E6%96%87
回复

使用道具 举报

0

主题

1

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-2-2 08:21:53 | 显示全部楼层
可以落在div级别的
回复

使用道具 举报

2

主题

7

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2023-2-2 08:22:24 | 显示全部楼层
好滴很[害羞]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver| 手机版| 小黑屋| 问答媒体

GMT+8, 2025-7-10 15:00 , Processed in 0.130672 second(s), 34 queries .

Powered by Discuz! X3.4

Copyright © 2020, LianLian.

快速回复 返回顶部 返回列表