如何只对比两个文本文件的汉字差异

yichuang · 2024 年10 月 1 日 00:25

有两个文本文件(.po)，内容包括各种字符，比如英文字母、数字、特殊符号、汉字等等。

我想做的是，对比这两个文件的差异，但我只想看汉字的差异。汉字以外的其它字符差异，一概不关心。

我使用meld工具对比，但由于文件内容比较多，会把所有字符的差异都列出来，导致我没办法一一查看，因为差异太多了。

有什么办法只对比检索汉字差异么？

lilydjwg · 2024 年10 月 1 日 05:05

.po 的话，你不如把 msgstr 单独拿出来，然后 diff？

yichuang · 2024 年10 月 1 日 05:49

把汉字条目提取出来单独成为一个文件，然后对比，这个应该可行。

不过，怎么把汉字条目提取出来？

lilydjwg · 2024 年10 月 1 日 06:35

sed -n ‘/^msgstr /,/^$/p’ 这样？

yichuang · 2024 年10 月 1 日 11:11

问题解决了

pi314 · 2024 年10 月 1 日 11:20

grep “^msgstr” 1.po > 11.po
grep “^msgstr” 2.po > 22.po

meld 11.po 22.po

lilydjwg · 2024 年10 月 1 日 11:28

你这属于没搞过翻译的。