计算机与多媒体
第二章 多媒体技术
人们阅读报纸、杂志和书籍等;听广播、讲座和收音机等;看电影、电视和戏剧等,通过这些手段可以获得信息。换句话说,信息传播的媒体可以是文字 (包括书籍报刊等)、声音(广播新闻、广告、音乐等)图像和景象等。多媒体技术是处理文字、图像、动画、声音和影像等技术。其中动画、声音和影像都是和时间相关的,因而,处理时必须考虑时间因素,特别是音像同步问题。根据多媒体数据的特点,可以将多媒体技术的组成归纳为:各种媒体的处理和信息压缩技术;多媒体计算机系统技术;多媒体数据库技术;多媒体数据通信技术。
第一节 音频
音频可分为:音乐质量音频,通常称为CD 质量音频或 16位音频;话音质量音频,也叫电话质量音频或8位音频。
音乐质量音频要求更快的采样速度和更高的采样精度,因此要求工作站有更大的存储容量和更快的处理速度。音乐质量音频应用在音乐界,如培训和演示等。典型的音乐质量音频输入来自CD (Compact Disk压缩盘)唱机或DAT (数字音频磁带)唱机,而输出则通过一个高质量的扬声器。话音质量音频能在有限的动态范围内重现人的话音。Sun 台式工作站全都具有话音质量音频功能,能使多媒体应用范围从电子话音邮件到文件的话音注释,甚至用话音控制工作站。话音质量音频通常由话筒或电话输入,可以通过工作站内或附加在工作站上的扬声器输出,或采用电话送受话器或扬声器电话输出。
特指音乐的MIDI (乐器数字接口)是一种针对特定音乐,面向音符的控制语言。MIDI 数据由规定音符和定时代码组成。这些代码可以由与 MIDI 兼容的设备产生或输出,如键盘或合成器。MIDI 通常应用于计算机音乐界,用于演播室控制和音频产生。多媒体音频应用依赖于许多因素的相互作用。多音频的处理包括数字化、编辑、存储和重放。
一、音频的捕获和数字化
声音或音频是模拟数据,要想利用计算机存储、加工、增强音频信号,必须对它进行数字化——转换成计算机能够识别的形式。音频作为一种复杂的模拟波形,它来自各种输入装置,如话筒、电话送受话器、与工作站相连的CD 唱机等。音频信号以其带宽和最主频率来表示,可以用波形表示。音频信号的量化包括两个步骤:采样和量化。通常由模数转换器 (ADC)来实现量化。
二、音频重放
重放存储的音频数据需将数字数据重新变为模拟音频信号。这是由数模转换器(DAC)实现的。模拟信号可以送给工作站内或附属于工作站的扬声器,或送给电话送受话器或扬声器。
目前,ADC 与其对应产品DAC 有时合并成一个叫做编码译码器,即 CODEC的芯片。工作站支持的音频质量主要由ADC 和 DAC 芯片的性能来决定。
三、音频编辑
人们可以对存储在文件中的音频数据进行各种操作,最普通的操作是编辑音频数据。音频编辑程序一般是产生一个代表数据的波形显示,然后使您可规定要删除或重新安排的数据。编辑功能可用来隔开感兴趣的段落,或去除开头和结尾的噪声,静默或中止。 Sound Tool (声音工具)示范程序可以对音频文件进行编辑。另外,可以对音频信号进行的操作是混合声音文件,例如将一段话音加在背景音乐上,提供训练应用或在演示中应用。
四、音频数据存储
音频信号被捕获并被数字化以后,把它存储在一个数据文件里,以供以后的重放、编辑或其它操作。即使是话音质量音频,其数据密度也是很高的,在SPARC 工作站中,一分钟话音质量音频几乎要占用0.5MB 的存储空间,一分钟未经压缩的音乐质量音频 (16位,44.1kH 立体声)几乎需要 10MB 的存储空间。
除了原始数据外,还需要存储与数据有关的信息,如采样率、每个样本
的比特数,以及所使用的编辑算法。这些信息对重放原始信号是必不可少的。因此音频数据通常存储在包含这个数据并具有特定格式的文件中,常常采用某种标题结构。这一般需要专门的程序,以把数据写入这些文件并能正确地阅读这些数据。
五、多通道音频
许多工作站,如SPARC 系列,只能支持单通道或非立体声音频。实际上多通道也是可能的。支持双通道 (立体声)需要两个输入端和两个输出端,每个数据流对应一个独立的 ADC/DAC 芯片 (或设计成能处理两个通道的芯片),以及适合于多通道数据存储的数据表示格式。
第二节 视频
正像视觉通信通过画面能够比单纯文字提供更多的信息一样,活动画面在某些情况下比静止图像能提供更多更好的信息。
全活动数字视频意味着在工作站中集成了一系列连续的图像。全活动数字视频实际上是几种相关的硬件和软件技术的结合,其中包括视频捕获、视频压缩和去压缩、视频在网络上传输、视频在工作站窗口显示、视频在磁盘或其它存储媒体上的编档保存等。
一、视频捕获 (输入)
从电视机和录像机所看到的视频信号是一种模拟信号。为了捕获视频信号,视频数据必须经过数字化并存储在存储器中或帧缓冲器中。数字化需要专用硬件并产生一个类似于Sun 光栅文件的数字图像。为了保存图像,图像必须通过现有的总线传送给存储器。捕获、存储或传输分辨率为 640×480的连续视频序列,对于8位或 24位图像,需要9~27MB/s 的带宽。这一带宽扩展超过了许多系统总线,如 SBUS LAN (Ethernet)、 WAN (ISDN)的带宽,因此,实时视频捕获通常还包括实时视频压缩,以便减小所要求的带宽。保存视频也需要压缩。如果不压缩,一分钟的视频数据几乎需要 1GB 的存储空间。
二、视频显示 (输出)
全活动数字视频显示一般是指从已经被数字化并压缩了的视频开始,而
这种视频信号是通过某些网络连接 (Ethernet或 ISDN),通过视频捕获装置 (如摄像机和录像机)或某些存储媒体(磁盘或CD—ROM)接收到的。显示视频必须去压缩 (最好以实时方式,如每秒30 帧)并送至帧缓冲器,以便在窗口上显示。
第三节 活动数字视频压缩与去压缩
视频压缩是为了满足减小网络和总线带宽以及减小视频编档保存空间的需要。视频压缩和去压缩的方法有许多种。
一、压缩/去压缩技术特性
压缩/去压缩全活动视频的特性包括无损与有损压缩、压缩比、帧内与帧间压缩、计算成本和对称与非对称压缩等。
1.无损压缩与有损压缩
无损压缩是指当图像被压缩后再压缩时没有信息损耗,即去压缩后的图像与原始图像相同。采用无损压缩常常是为了节省磁盘存储文本和二进制数据的空间。无损算法提供少量的压缩,如压缩前后之比为 2 ∶1。有些应用,如医疗图像或卫星数据判读,需要无损压缩。
有损压缩是指当图像被压缩后再去压缩时有信息损耗。即去压缩后的图
像与原始图像不完全等同。信息质量 (最终图像质量)随所采用的不同技术或同一技术所选用的参数不同而明显不同。一般地,压缩比越大,信息损耗量也越大。全活动数字视频采用有损压缩算法。
2.压缩比
压缩比描述压缩前后量值的变化,即压缩图像或视频所需存储空间大小的变化。
3.帧内与帧间压缩
帧内压缩一次只压缩单一图像,与先前的和随后的图像无关。先用其它算法做帧内压缩,然后再做另外的帧间压缩。这项技术比编码技术要昂贵得多,但对于给定压缩比来说,可以获得高质量的序列图像。这项技术能为通过LAN和WAN 传送的视频会议提供所需的很高比率的压缩。单纯帧内压缩技术更适合于静止图像。
不同的压缩技术,在压缩和去压缩图像方面所需要的计算机存储量有很大的不同。某些去压缩技术费用相对较低 (以时间和金钱度量),并且可以用标准工作站上的软件以合理的速度 (如10~30 帧/s)计算。目前其它技术都需要专门硬件才能以接近全活动视频的速率进行压缩或去压缩。
5.对称压缩与非对称压缩
对称压缩是压缩所需的计算费用与去压缩所需的计算费用大体相当的一种压缩技术。而非对称压缩技术是压缩费用明显高于去压缩费用的一种压缩技术。对称技术具有能够开发同时提供压缩和去压缩的专用硬件的优点。非对称技术则具有不用增加额外硬件即可提供廉价重放功能的优点。
二、压缩技术
下面列出最常用的几种压缩技术。
JPEG——静态图像压缩标准。
JPEG (Joint Photographic Experts Group)它是一种即将被承认的静止画面压缩的工业标准。它是一种压缩比为20 ∶1 的帧内压缩标准。
MPEG——动态图像压缩标准。
MPEG (Moving Pictures Experts Group)它是针对全活动视频的一种视频压缩标准。它是压缩比可达 100 ∶1 的一种帧间压缩方法。
P×64——P×64也称为H.261。该项技术是一种专门针对通过 ISDN线路传输视频即面向视频会议和可视电话的标准。
DVI——DVI (Digital Video Interactive)是 Intel公司在它们自己硬件上开发的一种专有视频软件体系结构。
RPZ——RPZ 是 Apple 公司专有压缩/去压缩技术,并且是它们的 QuickTime 系列多媒体应用软件的一部分。
第四节 动画
计算机动画 (Computer animation)是借助于计算机生成一系列可供动态实时演播的连续图像的技术。从动画制作的原理上可分为两类:计算机辅助动画 (Computer—asisted ani-mation )和基于造型动画 (modled animation)。计算机辅助动画属于二维动画,主要用计算机辅助系统的卡通片制做。基于造型动画属于三维动画,它首先建立三维空间中几何形体的造型,然后使之产生各种运动。
瑞士的N.M.Thalma和 D.THalman将计算机动画系统按功能划分为五级。第一级,只用于交互地产生、绘制、存储、检索和修改画面。它没有考虑时间因素,实际上只是由设计者使用的图形编辑器。第二级,可以计算中间画面;并可计算沿轨迹移动的对象,这种系统考虑了时间因素。它主要由中间画的动画师使用,甚至系统可以代替动画师的工作。第三级,提供给动画师对活动对象的操作手段,如:平移、旋转等。同时也包括虚拟摄像机的操作。第四级,提供定义角色 (actor)的工具。这些角色具有自已的运动特色,他们的运动可以是受约束的 (行为约束,对象之间的约束等)。第五级,系统具有可学习性和扩充性,随着多次使用,系统逐渐变得更完善和更智能化。
按照动画的记录方式分类,可分为:逐帧方式动画系统和实时方式动画系统。逐帧方式是指由计算机生成动画中的每帧画面,并记录下来,然后,可以按24 帧/秒 (电影)或25 帧/秒 (电视PAL 制式)或 30 帧/秒 (NTSC 制式)的速度播映。目前的动画制作系统大多属于此类。实时方式是指可直接在终端上实时显示动画图像。
第五节 多媒体数据库技术
多媒体数据的类型不同,表示方式也各不相同。当用数据库支持多媒体应用时,需要将多媒体数据对象各种表示的固有特性 (如是否采用编码形式或结构形式等)映射到相应的表示形式,如正文文件、图像参数文件、图像数据文件、图形结构表等。多媒体数据库应能处理数据对象的各种表示方式,例如在图形上叠加图像等。
不同对象的表示形式、存取方式、绘制方法各不相同,因此,多媒体数据库还应包括处理不同对象的相关方法库。多媒体数据库与方法库应紧密相关联,以便进行数据对象的组合、分解和变换等操作。另外,为了管理数据对象方便,应建立数据对象的说明,以便于定义数据对象的二级属性。因此,数据对象、数据对象的说明以及与对象相关联的方法是多媒体数据的三个组成成分。多媒体数据库的另一特点是存在着时间上的限制。这里主要是指实时性和同步要求都很严格。
数据库系统的长处在于给定一个用户查询后,可以迅速地检索到正确的信息段。而多媒体数据库不是对现有的数据进行界面上的包装,使之看起来像一个多媒体数据库,而是应该从多媒体数据与信息本身的特性出发,考虑将其引入到数据库中之后而带来的有关问题,才能找到相应的解决办法。
一、多媒体数据类型
多媒体数据可分为如下几类;数字字符型关系数据、文本数据、声音数据、图像数据。下面分别给以介绍。
1.数字字符型关系数据
人们完成对信息的抽象后,就要建立与实体之间的关系。它经常由字符和数值构成,具有非常规范的结构化形式。因为采用结构化的形式后,使数据的内容表达得比较明确,所以,数据库对这种数据的操纵特别方便。
2.文本数据
计算机最早就可以处理文本数据,这在情报检索中得到了广泛地应用。这种以长短不同的顺序字符流组成的文本其实也具有许多独特的性质,但就数据库而言,在理论和实践上都没有充分地反映出这种性质。各种书籍、文献、档案等都是由文本媒体数据为主构成的。文本是最常见的媒体形式。
3.声音数据
有了声音能够使一个对象或过程变得生动,而这种生动又带有了信息,同时声音也是应用中必须考虑的需要进行的有效管理的媒体,例如字典中每一词的发音、鸟类数据库中鸟的叫声等。声音可以辅助其它媒体的表现,起到与感觉相同的效果,如解说、注释、音响效果等。但高质量的声音需要大容量的存储。通常,单声道较好音质的声音数字化后需每分钟上兆的存储量。声音也可以由音库中的音符合成而得,这样只需存储符号而无需存储波形。中文语言合成效果尚不十分令人满意,但音乐合成效果已经很好了。抽象化的声音数据已经转化为文本,许多成熟的技术都可以利用,非常有利于检索。但如果对波形声音直接识别,还存在着一些困难,这对数据库的检索将是不利的。
4.图像数据
图像数据的表示方法有多种,分别基于抽象程序或时间。位图式图像在照片、绘图、医学图像等方面经常采用,它只是对原图像的一种数字化。图形是图像矢量化的结果,它是对原图像实行了某种程序的抽象而得,反映了一个物体的关键特征,常用于地理图、CAD 图等方面。图形和图像按一定顺序组成时间序列,就是动画和数字化视频,这时数据的组成及内容与时间就有了密切的关系。一幅较高分辨率数字化的彩色图像约需 1MB左右的存储空间,图形则由于抽象绘制指令而使存储量少得多,而动态视频由于在时间上的连续变化,通常每秒为25~30 帧,对存储的要求要大得惊人,如不压缩处理几乎无法使用。
二、多媒体数据的特点
多媒体数据与传统数据库数据有显著的不同,因此,多媒体数据库有如下特点。
数据量巨大且媒体之间量的差异十分明显,而使得数据在库中的组织方法和存储方法复杂。如何组织好多媒体数据库的数据,选择设计合适的物理结构和逻辑结构,才能保证应用的快速存取。数据量大相应地支持信息系统范围扩大,同时应用范围也扩大了。
媒体种类的繁多使得数据处理变得复杂了.前边介绍了四种多媒体数据,而实际上,在具体实现时,常常根据系统定义、标准转换而常演变成几十种媒体形式。从理论上讲,多媒体系统应能接受任何形式的数字化媒体形式,但却很难了解并且正确处理这些媒体的语义信息。这些基于内容的语义在有些媒体中是易于确定的,但对另外一些媒体来说却不易于确定,甚至会因为应用的不同和观察者的不同而有差异,也不能仅用人工输入的方法加以限定。面向对象的方法使异质数据类型的统一处理问题得到了缓解,但尚未完全解决。
多媒体不仅改变了数据库的接口,使其声、图、文并茂,而且也改变了
数据库的操纵形式,其中最重要的便是查询机制和查询方法。媒体的复合、
分散、时序性质及其形象化的特点,使得查询不再只通过字符查询,查询的结果也不仅仅是一张表,而是多媒体的一组 “表现”。接口的多媒体化将对查询提出更复杂也是更友好的设计要求。
三、数据模型
数据库的操纵与数据模型有关。数据模型不断完善和变革,每一种模型各有千秋,但又都有局限性。关系数据库其数据模型是基于数值的,很适于表格一类的应用。但对于多媒体这样的数据却不能适应。面向对象的方法提供了一个基于抽象的模型。允许设计者在基本功能实现上使用最适合于他们应用的技术,这对于多媒体环境下复杂程度不断增长是很有好处的。研究表明,一般的面向对象数据模型为适应多媒体数据库的需求,还必须考虑媒体对象之间的时空关系,考虑媒体对象或是数据对象之间的语义关系及结构形式,它往往反映了数据之间的关系 (事实)。
超媒体的形式是一种能够较好反映多媒体特点的数据模型形式。对它的形式化描述也在逐渐完善。合理与恰当地设计会使其比较合理地组织并管理好多媒体数据,适应多媒体数据在复合性、时序性、分散性方面的要求。超媒体的节点及内部结构可以按表现的需要对多媒体信息进行时空组织,并且通过节点之间不同类型的链建立起数据与数据之间的关系,描述出信息、网络的语义。
四、数据库操作
多媒体数据库的操作有:检索与查询、浏览、梗概及统计查找,多媒体对象的表现。
1.检索与查询
在数据库中,大部分操作是查找而不是修改。检索与查询通常分为基于表示和基于内容两类。基于表示形式的检索与数据所表示的类型和数据结构有关,不需要对内容做任何分析,在多媒体数据库中常用于复合媒体对象的检索。例如, “找出具有声音注释的图像”,或“找出所有动画”等都是这一类。对语义网络结构的检索则要复杂一些,例如, “找出能够说明(与之
关联)的所有对象结构”将得到一个由若干对象组成的语义子网,在超媒体
中会有这种查找。
基于内容的检索是根据媒体内容语义进行。最容易做到的是对文本媒体
的内容检索查找,由用户描述一组对象,然后对内容进行匹配。例如, “找出所有含有Multimedia 的句子”。对于图像、声音这一类媒体来说,基于内容的检索和查询就要困难得多,这需要借助于模式识别进行语义分析和特征匹配。符号标注法对于实现者来说会使事情变得容易,而自动语义分析对用户来说则更为有利。显然,一幅图像不能用字符而只能靠实例。这种检索与查询形式不可能是完全匹配的,只能是相似性查询。因此要确定相似函数的特征因子,是用户减少检索空间和结果空间的重要问题。与相似性有关的是可信度。查询是非确切的,系统应该根据它们匹配程度的高低进行确认,这种尺度就是可信度。
2.浏览
多媒体数据的语义较复杂,很难定义准确的查询,只有通过浏览才能找到特定的信息。在多媒体信息组织上往往要建立起合适的关系,超媒体网络是支持浏览较好的形式。由于媒体之间可以相互配合,从一种媒体 (如图像)的某一特定区域,可以同时指向用另外一种媒体 (如文本符号)所描述的数据上,用户可以随时切换。浏览机制还可以支持一种带有过滤机制的查询,即滤波浏览。这种方式将限制用户所不关心项目的出现,被滤除的信息范围既可以是用户自已明确指定的,也可以由某种智能机制通过已有的查询自己识别或设定。
3.梗概及统计查找
对多媒体数据的梗概查找将是一个逐步求精的过程。一般是抽取媒体的对象中最关键的特征,例如一座房屋图像的粗略外观、轮廓、声音中特定语句的关键特征等。可以从一种媒体转变为另一种媒体,也可以只在其它参数上变化。统计则是通过观察大量非符号化的数据而对数据得出的某种结论,这种结论在后续查找中将支持其它的查找。
4.多媒体对象的表现
多媒体数据将导致一组媒体在时空上组成对该结果的信息表达,这就是表现。表现的组织过程就是查询结果组织,例如以肖像形式列出全部检索到的图像。
第六节 多媒体通信技术
多媒体技术与通信技术的完美结合,使得通信领域中诸如可视电话等陷入困境的行业,焕发了新的活力。多媒体通信技术集计算机交互性、网络的分布性和多媒体信息的综合性于一体,突破了计算机、通信、电视和出版等传统产业间的界线,使这些对人类社会产生重大影响但相对独立发展的技术融为一体。多媒体通信技术向人类提供了全新的信息服务,如:多媒体电子邮件、实时视频会议、计算机支持的协同工作,以及远距离学习和远距离医疗等。
多媒体通信是一个综合性的技术,涉及多媒体、计算机及通信等领域,并且给这些领域带来很大的影响。大数据量的连续媒体在网上的实时传输不仅向窄带网络及包交换的协议提出了挑战,而且对于媒体技术本身,如数据的压缩、各媒体间的时空同步等也提出了较高的要求。
一、多媒体网络
多媒体网络为多媒体通信提供了一个传输环境,网络的带宽、信息交换方式以及高层协议,都将直接影响着传输及服务的质量。
多媒体网络包括:电话网、综合业务数字网、公用数据网、计算机局域网等。
电话网采用电路交换方式,在这种方式下,信道是独占的,有利于连续媒体传输。但是,在电话线路上传输是模拟信号,数字信号必须经过调制解调器处理之后才能进行传输。电话网的速率一般只有 19.2Kbits/s,无法传输视频等大数据量的媒体。
公用数据网和高速专线网的传输率比电话网有所提高,但是使用费非常昂贵。
窄带综合业务数字网 (N—ISDN)也是采用电路交换,这种方式具有较小的延迟。窄带综合业务数字网有两种用户网络接口:基本速率接口和基群速率接口。基本速率接口的结构为2B+D,即两个B信道和一个D信道。B信道的速率为64Kbits/s,用于传输标准的数字电话以及其它一些数据;D信道的速率为 16Kbits/s,用于传输信令等控制信息。这样,其总数据传输率为144Kbits/s。对于基群速率接口,其结构在欧洲为30B+D,在美国为23B+D,其中B 信道和 D 信道的速率都是 64Kbits/s。由此看来,窄带综合业务数字网就是具有较高的传输率,可以传输声音和低质量的视频信号。
计算机局域网采用包交换方式传输数字信息,它把用户的数据分割成许多小段 (称为包、分组等)在网上传输。包交换方式的特点是传输速率高,并且可以根据需要改变速率,如现在常用的以太网。这种网络的数据传输率一般为 10Mbits/s。其缺点是传输延迟大,不适合音频和视频信号的传输。
宽带综合业务数字网(B—ISDN),其传输介质采用同步光纤网(SONET),信息交换方式采用异步传输模式 (ATM)。这种方式具有电路交换延时小,分组交换速率高及速率可变特点。宽带综合业务数字网的传输速率将达到2.4Gbits/s,在其上可以传输高保真的立体声、普通和高清晰度的视频,是多媒体通信的理想环境。
由于条件限制,在近段时期,我国多媒体通信的研究和应用将集中在计
算机局域网(LAN)上进行,其中包括以太网(Ethernet)、令牌环(Token Ring)
以及光纤分布式数字接口 (FDDI)等。对于在广域网 (WAN)上进行多媒体通
信只能做一些试验。
第七节 多媒体人机界面
所谓人机界面,指的是人与机器之间为完成某种任务或执行某些命令而进行信息交换所采取的手段或通过的渠道。人机界面根据信息的流向分为两类:输入界面和输出界面。输入界面指的是人向计算机输入信息的方式,通常包括键盘、鼠标、操纵杆、跟踪球和扫描仪等。输出界面指的是计算机向人传递信息的方式,传统的输出方式是屏幕显示或打印机打印输出。实际上计算机用户总是希望人机之间的交互能以人们习以为常的方式直观、自然地进行。也就是说,人机交互能够采用与手写体文字、语音、图像和无线等方式进行,这些就是多媒体人机界面。本节主要根据市场上的产品信息及最新报告,简要说明现有多媒体人机界面的发展水平以及在便携式电脑中的应用现状。
一、笔输入技术
笔输入是便携式计算机广泛采用的输入方式。笔输入技术指的是计算机的操作者用书写笔在图形输入板上进行书写或操作,计算机通过一套软件或操作系统对图形板的输入进行加工、识别,从而接收信息。下面介绍笔输入系统。
1.图形输入板及书写笔
图形输入板和书写笔的关系就像通常的纸和笔。书写笔在图形输入板上书写时,计算机通过检测电压或电流的变化来记录笔划的信息。笔划的粗细是可控的。例如,EO和Con- certo。都可设置笔划。将图形输入板和液晶显示屏做到一起,书写或删改都十分方便。
2.电子墨水
用户在液晶屏上书写时,笔尖走过的地方会留下墨迹,这就是所谓的电子墨水。计算机通过读取电子墨水,并进行识别得到期待的计算机文字。另外,计算机也可以对所有的电子墨水不做任何处理,以图形方式将其保留,这就是通常的手写体,等同于笔在白纸上写字、作画,与哪种文字无关。现在市面上能见到的笔输入电脑都具备这些功能。
3.手写体识别
手写体识别是计算机辨识、确认手写体字符的过程。通常分为两类:联
机手写体识别及脱机手写体识别。联机识别是边书写边识别。用户输入时可一边输入,一边修改,直到输入正确为止。脱机识别是在识别之前先将所有的字符写好,通过扫描仪等设备输入计算机,然后进行识别,要求一次识别成功,否则要全文校对。目前,笔记本电脑采用的是联机手写体输入,但各个产品采用的识别方法不尽相同。AT&TrEOt Compaq 的Concerto486 采用的基本识别单元是26 个英文字母和 10个数字。这个方案可以识别任何一个英文字词,不必建造一个大的字库。Apple 公司的 Newtn 系统识别的基本单元是字词。它提供了约3000 个英文字库,这种方案的识别速度、识别率都比识别单元字母要高。Newton 系统还具有图形识别功能,例如,如果用户划一条线或一个圆,系统会自动替你修正。我国的汉王99 汉字识别软件可识别手写汉字,且具有较好的效果。
4.笔输入操作系统