如何只对比两个文本文件的汉字差异

有两个文本文件(.po),内容包括各种字符,比如英文字母、数字、特殊符号、汉字等等。

我想做的是,对比这两个文件的差异,但我只想看 汉字 的差异。汉字以外的其它字符差异,一概不关心。

我使用meld工具对比,但由于文件内容比较多,会把所有字符的差异都列出来,导致我没办法一一查看,因为差异太多了。

有什么办法只对比检索汉字差异么?

.po 的话,你不如把 msgstr 单独拿出来,然后 diff?

把汉字条目提取出来单独成为一个文件,然后对比,这个应该可行。

不过,怎么把汉字条目提取出来?

sed -n ‘/^msgstr /,/^$/p’ 这样?

1 个赞

问题解决了 :+1:

grep “^msgstr” 1.po > 11.po
grep “^msgstr” 2.po > 22.po

meld 11.po 22.po

你这属于没搞过翻译的。