黑马校对

王朝百科·作者佚名  2010-02-02  
宽屏版  字体:   |    |    |  超大  

黑马校对

黑马校对软件是北京黑马公司开发的一款用于文字校对的实用软件,可以校对各类中英文错误,是目前国内唯一的专业校对软件,已广泛应用于出版社、报社、期刊、办公等各个领域。目前最新的版本是黑马校对V12.0全能版(2009.12发布了黑马校对V15.0)。

黑马校对的主要功能和特点:1. 精确校对各种中文、英文拼写、标点、数字、科技计量、重句、异形词、领导人姓名职务、领导人排序、政治性问题、目录、标题和图例公式序号等各种类型的错误。

2. 内含S2版、PS版、Word嵌入版、飞腾插件版和小样版五个校对界面,支持目前所有主流排版系统,适用范围极广。可以直接打开排版大样,屏幕上显示完整的版面,也可以嵌入在Word、飞腾中校对。

3. 依据《现代汉语词典》第5版等权威标准。采用多项国际领先的尖端校对技术和超大规模词库,拥有4000万条专业词汇、220万条错误词汇和79个专业库。为各类文稿的校对提供最佳解决方案。

专业词库词汇量4000万条,包括政治、经济、法律、新闻、外交、财政、证券、会计、审计、物理、数学、机械、纺织、计量、历史、文物、交通、邮电、农业、化工、冶金、石油、煤炭、水利、铁道、图书、印刷、医学、电脑、电子、电力、教育、体育、少儿、戏剧、音乐、美术、广播、宗教、民族、军事、航空、航天、地理、地质、海洋和地震等79个专业词库。符合全国科学技术名词审定委员会制定的标准。

4. 自由定义用户库、错误库、建议库、职务库和排序库等用户词库。量身打造校对新标准。

强大的敏感词校对功能,支持中英文、数字、标点、符号等任意字符串组成的词条。可以自由挂接外来词库。

黑马校对系统系列包括黑马校对全能版、黑马校对医学版、黑马校对杂志社专用版等几个不同版本。

目前国内已有95%以上的出版社、近万家的报刊、印刷企业、文化公司和机关办公等单位和个人正在使用黑马校对系统。

黑马校对技术原理:1. 正向查错

依靠语言模型来进行汉语依存关系分析 ,也就是对大量分类语料中的上下文和语句关系进行量化的统计、分析、提炼,并采用高倍信息压缩、快速检索、汉字高精度快速切分等先进技术 来生成语言模型和依存分析算法。

目前语言模型中知识库词条达4000万条之多。

为提炼不同领域的文字特征,黑马分析处理了涵盖自然科学、社会科学十大分支的300亿汉语语料,同时鉴于中文的复杂性,为了提高语言模版的准确性和减少信息垃圾,我们每年投入30余名数据处理人员对计算机智能分析结果进行人工核查。

2. 反向查错

黑马公司长期坚持不懈地大量收集各种常见错误,包括:写作人员似是而非错误、五笔字型录入人员常见错误、拼音录入常见错误、OCR识别有规律的错误、各专业废除词条、不规范科技计量单位、国家语委确定的非规范词条 、各类政治性错误等。

目前最新的黑马校对V12F.0全能版错词库容量已超过220万条。

3. 从实际需求出发,增强校对功能

黑马校对软件不仅在核心技术上保持着领先地位,而且还针对广大用户的实际使用地改进版本,扩大软件的适应性,使其更具实用价值。

黑马校对系统的早期版本可以校对各种排版格式的小样文件,后来为方便校对人员对稿,增加了把大样文件转换成文件文件,保留页码信息的功能。后来,黑马公司研制出软件RIP技术,开发了可以直接显示并校对大样文件的S2版和PS版。为了方便编辑、排版人员的校对和修改,开发出了嵌入到Word中校对的Word版和最新开发的嵌入方正飞腾排版系统的飞腾插件版。

黑马校对能够校对的错误类型:黑马校对V12F.0全能版采用最新的校对引擎和超大规模的核心词库,具有强大的校对功能。可以校对的错误类型包括中文、英文、标点、重句、科技计量、数字、领导人、政治性问题、异形词、目录、标题和序号等错误。

◆ 错别字

错别字一般是正字的音近字或形近字。五笔字型录入时经常产生形近字错误,拼音录入时经常产生音近字错误。此类错误人工校对不易发现,是多次校对后遗留错误的主要来源。

例: 时侯(正:时候);分岐(正:分歧);土尔其(正:土耳其)

--------------------------------------------------------------------------------

◆ 多字、漏字

多字、漏字错误是录入时经常出现的错误,往往会造成语句不通。

例: 美丽的的心灵(正:美丽的心灵);革命文团体(正:革命文艺团体)

--------------------------------------------------------------------------------

◆ 词语搭配不当和部分语法语义的错误

词语搭配错误的形式很多,语法错误的类型也十分复杂,黑马校对目前可以校对绝大部分词语搭配错误和部分语法方面的错误。

例: 中华人民解放军(正:中国人民解放军);兴奋的想(正:兴奋地想);他的丈夫(正:她的丈夫)

--------------------------------------------------------------------------------

◆ 异形词、繁体词

随着国家语委新标准的颁布,旧的异形词已被废除,不再使用。此外,简体字文章里一般不应出现繁体字词。

例: 磨拳擦掌(正:摩拳擦掌);在他毕业之後(正:在他毕业之后)

--------------------------------------------------------------------------------

◆ 英文错误

黑马校对软件可以校对英文单词的拼写错误,目前还不能校对英文语法错误。

例: cowpatible(正:compatible)

--------------------------------------------------------------------------------

◆ 标点错误

可以校对的标点错误包括成对标点使用不当、两个标点挨在一起、省略号使用不当等。

例: 人们称它为森林卫士”

--------------------------------------------------------------------------------

◆ 数字错误

黑马可以校对出不符合逻辑的数字错误和不规范用法等。

例: 14月33日(一般情况下,月份不能超过12,日不能超过31);98年(正:1998年)

--------------------------------------------------------------------------------

◆ 政治性差错

政治性错误包括比较敏感的涉及台湾问题和重要的国家领导人姓名、职务及搭配、领导人排序错误等。黑马可以帮助用户避免此类错误。

例: 美国、日本和台湾等国(正:美国、日本等国和台湾地区);温家宝副总理(正:温家宝总理)

--------------------------------------------------------------------------------

◆ 重句错误

重句错误多是由排版人员的误操作而重复排版产生的错误。黑马校对的重句检查功能可以有效地检查出文章里的重句错误。

--------------------------------------------------------------------------------

◆ 科技计量错误

黑马可以校对出一些科技计量单位用法不规范的常见错误和非法定计量单位错误。

例: 15Kg(正:15kg);13平米(正:13平方米)

--------------------------------------------------------------------------------

◆ 目录错误

目录错误主要是目录页中的标题名称、页码与正文中的标题名称、页码不一致。特别是多次改版的图书经常会出现此类错误。

--------------------------------------------------------------------------------

◆ 标题错误

校对文件中各级标题的字体、字号是否一致。

--------------------------------------------------------------------------------

◆ 公式、图例序号错误

校对文件中出现的公式、表格和图例的序号是否正确。

--------------------------------------------------------------------------------

◆ 用户自定义错误

校对由用户自己定义的各类错误。

更详细的资料请访问:http://www.bjhm.com.cn

 
免责声明:本文为网络用户发布,其观点仅代表作者个人观点,与本站无关,本站仅提供信息存储服务。文中陈述内容未经本站证实,其真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
 
© 2005- 王朝百科 版权所有