自动将(非英语)评论翻译成英语?

Sau*_*abh 5 comments translation google-translate spoken-language translate

我有一个 Matlab 代码库,它的注释是用瑞典语写的。它是这样的:

% Syntax: result = ocr(DOC, METHOD, fname)
% DOC - bild som ska processas
% METHOD - ann eller knear
% fname - full filename of the net ('ann' method) or the database 
%         ('knear' method)
%         default: ann20.mat resp db4000.mat
function result = ocr(DOC, METHOD, fname)

% Segmentera bilden
disp('Segmenting...');
[ROWB, CH] = segment(DOC, 0.99, 0.99);

% Analysera den 
switch lower(METHOD)
  case 'ann', 
    % ladda in neuronnät, inför NET, E, CP
    if isempty(fname)
      load ./db/ann50.mat;
    else
      load(fname);
    end
Run Code Online (Sandbox Code Playgroud)

好吧,谷歌翻译出来对我来说是个大救星。这是复制粘贴到翻译框的结果,非常令人满意。

% Syntax: result = ocr (DOC, METHOD, fname)
% DOC - image to be processed
% METHOD - ann or knear
% Fname - full filename of the net ('ann' method) or the database
% ('Knear' method)
% Default: ann20.mat respectively db4000.mat
function result = ocr (DOC, METHOD, fname)

Segment image%
disp ('Segmenting ...');
[ROWB, CH] = segment (DOC, 0.99, 0.99);
% Analyze the
switch lower (METHOD)
   case 'ann'
     % Load the neural networks, for NET, E, CP
     f isempty (fname)
       ./db/ann50.mat load;
     else
       load (fname);
     end
Run Code Online (Sandbox Code Playgroud)
  1. 对于多文件代码库,我可以自动化这个过程吗?
  2. 如何处理转换为"% Segmentera bilden"to等错误"Segment image%"

Spr*_*ofi 0

你不能依赖谷歌翻译将%保留在行前面;众所周知,它会随机切换标点符号,甚至组合或分隔行。它还可能尝试翻译代码字或变量。为了获得可靠的解决方案,请创建一个小帮助程序脚本,例如使用 Ruby 或您选择的快速而肮脏的编程语言。

这个辅助脚本应该
* 遍历代码库中的每个文件(首先备份)
* 查看每一行而不对其进行评估
* 提取 % 之后的所有内容并将其输入到 Google 翻译中(每个评论的单独请求,以防止混淆) )
* 用文件中的谷歌翻译替换瑞典语注释
* 保存文件并获取下一个文件