翻译公司里那个所谓的“译前排版”到底是干啥的?深圳这边给翻译流程铺的第一道工序,就是为了让后面干活的人能舒服地在那翻山越岭。说白了就是把那些乱七八糟的源文件给收拾干净,好让咱们干活的时候眼神更亮堂、手更麻利。毕竟要是碰到那种扫了就没法改的PDF、拍下来的图片或者CAD图纸,没这一步直接动手,那后面准得绕大弯子返工。 咱们一般干的事儿也就那几样:先把那些乱七八糟的批注、水印、广告啥的都删了;接着把标题这些格式定死,好让目录能自动弹出来;再给图和表编上号写个说明,省得翻译的时候把重要东西给漏掉;然后字体字号这些也得统一一下,免得中英文字符长度不一样把版面搞乱;最后还得把术语表和品牌风格指南同步给人家备着。 这种活儿在哪都能派上用场。像是药品说明书、设备手册这种技术文档,你得死死地把那些编号、警示符号护住;合同协议这些法律文件也得保证条款一个都不少;多语言本地化这块儿,你要是给机器翻译(MT)弄个清爽的输入文件,质量肯定能上去不少,也不用让译员后面再去费力地抠细节了。 它跟译后排版最大的区别就在于——前面这一步是在“防错”,后面那一步才是在“美化”。 到底哪些文件需要先做处理?你把这个清单列一下就明白了: 要是碰到扫描版的PDF或者图片型PDF,你得先把里面的文字提出来,校正OCR的错误,再把图表编号标好; 扫出来的JPG、PNG、TIFF这些图片肯定得先用OCR转成文字; CAD图纸里的DWG和DXF格式要把文字跟图形拆开来看; PowerPoint(PPT、PPTX)要统一母版; Excel(XLS、XLSX)得清理合并的单元格; Adobe InDesign(INDD)、Photoshop(PSD)、Illustrator(AI)这些设计稿得保留样式和嵌入字体的信息; HTML和XML需要把标签给剥掉,保留住结构语义。