翻译公司里那个所谓的“译前排版”到底是干啥的？

翻译公司里那个所谓的“译前排版”到底是干啥的？深圳这边给翻译流程铺的第一道工序，就是为了让后面干活的人能舒服地在那翻山越岭。说白了就是把那些乱七八糟的源文件给收拾干净，好让咱们干活的时候眼神更亮堂、手更麻利。毕竟要是碰到那种扫了就没法改的PDF、拍下来的图片或者CAD图纸，没这一步直接动手，那后面准得绕大弯子返工。咱们一般干的事儿也就那几样：先把那些乱七八糟的批注、水印、广告啥的都删了；接着把标题这些格式定死，好让目录能自动弹出来；再给图和表编上号写个说明，省得翻译的时候把重要东西给漏掉；然后字体字号这些也得统一一下，免得中英文字符长度不一样把版面搞乱；最后还得把术语表和品牌风格指南同步给人家备着。这种活儿在哪都能派上用场。像是药品说明书、设备手册这种技术文档，你得死死地把那些编号、警示符号护住；合同协议这些法律文件也得保证条款一个都不少；多语言本地化这块儿，你要是给机器翻译(MT)弄个清爽的输入文件，质量肯定能上去不少，也不用让译员后面再去费力地抠细节了。它跟译后排版最大的区别就在于——前面这一步是在“防错”，后面那一步才是在“美化”。到底哪些文件需要先做处理？你把这个清单列一下就明白了：要是碰到扫描版的PDF或者图片型PDF，你得先把里面的文字提出来，校正OCR的错误，再把图表编号标好；扫出来的JPG、PNG、TIFF这些图片肯定得先用OCR转成文字； CAD图纸里的DWG和DXF格式要把文字跟图形拆开来看； PowerPoint（PPT、PPTX）要统一母版； Excel（XLS、XLSX）得清理合并的单元格； Adobe InDesign（INDD）、Photoshop（PSD）、Illustrator（AI）这些设计稿得保留样式和嵌入字体的信息； HTML和XML需要把标签给剥掉，保留住结构语义。