首页 > 历史军事 > 临高启明 > 三百零二节 修电脑的人

三百零二节 修电脑的人(5/5)

目录

“三行区上打孔,搭配1-9数字行打孔,共有3x9=27中方案,除去0-1位置表示特殊符号‘斜线’,刚好能表示26个字母。有意思的是,之所以用0-1表示斜线,则是因为整个方案中,就只有这个编码两个孔的距离最近,技术实现难度较大。此外,其他的特殊符号则可以用每列穿3个孔的若干方案解决。霍勒里思代码里仅用了8号孔作为搭配的孔,但这同时也揭示了,3孔编码在技术上是可能的。”

“之所以提到3孔编码,是考虑到中文编码的问题。”

这时会场出现了不少窃窃私语的声音。中文的编码是元老院应用穿孔卡的一大问题。当年穿孔卡计算机没有在国内自行生产,用途也不广泛,实际并无标准的中文编码方法。

穿孔卡比起元老们熟知的数据存储载体,容量实在小得可怜,每张的卡片只能存80个字符,还只是英文字母。如果要是政府或者商务的业务处理也就罢了,大不了多用标准编号,比如几年前司凯德和洪璜楠力推的国家标准代码体系,终于有了用武之地。

仅就眼下人口普查的需求来说,性别、籍贯、出生地、出生时间、现居所、文化水平、家庭成分等问题其实都可以很容易地通过编码解决,过去18位身份证上面仅用了6位就表示了全国每个人的出生地。原因很简单,命中每一个编码的人都很多,编制编码表是合适的。学过数据库的人画个ER图就很容易发现本来就应该这么做。但是唯有一个字段,就是姓名,永远也绕不过中文编码的问题。人口普查表各字段的具体设计工作可以丢给民生省的人,可是这中文编码必须现在解决。

“其实中文编码问题不难解决,问题是占用空间太大。”

“1980年颁布的《信息交换用汉字编码字符集》,通称GB2312编码,不仅仅规定了汉字在计算机上的表示方法,其实也定义了一套使用4位十进制数字表示汉字的方法,就是区位码。区位码收录了一级汉字3755个,二级汉字3008个,符号682个,基本满足当前需求。所以最简单的中文编码方法就是每4列编码一个汉字,大家以前高考的时候都涂过自己的姓名,当时用的就是区位码。”

“目前邮电部在全岛的电报系统已经基本铺设完成,电报员也培训了好几批。我看是不是直接用我们的标准中文电码更方便?人手也可以通用。”这时一直没怎么发言的绍宗开口了。

“区位码在每级汉字内部排序是按照拼音顺序,不怎么用培训吧。反而是标准电码是按部首排序的,实际上比掌握区位码难得多。”

“标准电码从19世纪末就有雏形,直接从清朝那时就编制了,是现阶段汉字编码的自然之选。”

“说话容易还是写字容易?标准电码从字形入手那是因为开始用电报的都是读书人阶层。我们的国民普及教育从拼音入手实际已经颠覆了过去的体系,普通人当然是用区位码更方便。”

“美国护照当年用的可一直是标准电码。”

……

……

区位码和标准电码之争持续了一小会,最后还是因为区位码直接和以后电子计算机的汉字国标码挂钩而获得了多数与会者的倾向性赞同。

“农业口要控制土地,工业口要控制技术,财金口要控制货币,军政口要控制位子,到咱IT圈,就要控制标准啊标准。”冯诺神秘一笑,心理暗想。

“如果采用4位数字编码1个汉字的话,每张穿孔卡片可以存储20个汉字。”编码方案本身,与编码在穿孔卡上的表示实际是两个问题。如果按穿孔与否作为2进制的观点来看,每列实际上有12位,一个半字节的信息。足可以编码4000多个字符。

“这也太少了,好像还不如80个英文字母的信息含量大,7张卡片才能发一条微博,还没算标点符号。”又有人说道。

“4位数的中文编码在实践中可以用两列来表示,只是机械设计的难度会增大。具体方案请大家查看附录3。”

原来冯诺的设想是每列打3个孔来表示两位数字,其中在每列的0-9位置上打两个孔表示两位数字。高区11行打孔表示下面穿孔的两位数字从小到大排列,12行穿孔表示下面穿孔的两位数字从大到小排列。

“两位数字相同怎么办?”

“11行和12行同时穿孔,0-9只打1个孔。下一页有说明。”

不过3孔的方式虽然能把汉字编码长度缩减到一半,让一张卡片最多存储40个汉字,但显然机电系统和控制系统设计都不是一日之功,讨论来讨论去,会议还是决定本次人口普查的卡片设计采用4位数字编码汉字,毕竟欧美人姓名也是动辄十几个字母,相比之下汉字姓名也不算太长。

冯诺接下来又简要介绍了资料上的一些内容,最后特意说道:“我们做这个工作时间比较匆忙,部分资料查得有不到位的地方,以后也会继续完善。督……马国务卿对机械式计算机的研究很久也很深入,期望能给我们一些方向上的指导和细节上的补充。”

马千瞩笑着说,“我今天本来打定主意只带着耳朵来。不过你们讨论得这么热烈,我就当自己是个爱好者说两句。你们的工作还是很充分细致,我只提两点,一个是机电设备的制造,继电器的开发有没有把握?工作要先易后难,先急后缓,就人口普查来说,最紧迫的是什么?打孔机器,量产可靠便携耐用的打孔机器,而打孔机器又是穿孔机系统里最基本、最简单的设备。也最容易设计制造。调查需要时间,后面的设备可以同步研发制造。等调查做完了,卡片收上来了,等一等也是可以的,宁可让数据等机器,不让机器等数据。这是第一点。”

“第二点是卡片,我看精度要求还是要符合咱们生产力的现状,建议你们把造纸厂和印刷厂的同志们请来一起商量一下,德隆现在在造纸币,他们的经验也要听一听。现阶段技术成熟、能够稳定量产、成本上可以接受的卡片标准是什么样的,一开始慢一点、粗一点不要紧,有原型系统,后面的事情就好办……”

“我可以补充一下1890年打孔卡技术,我之前也查了一些资料,1890年美国人口普查也用80列卡片,但是当时打的是圆孔,卡片尺寸与现在我们说的IBM卡还不一样,打孔设备极为简单,几乎就和我们过去坐火车检票的钳子差不多,人工打孔,也没有印制对应取值的功能。错误率和偏斜律高达1/20。同期的分类机和制表机想必也精密不到哪里去。而就是这样简陋的机器设备水平,仍然比1880年人口普查的统计效率高出百倍千倍。这样的水平,我们完全能够超越。”

“工业化不是一蹴而就的,科技树也不会一枝独秀,每个点上都要齐头并进。手摇计算机项目暴露了我们机械制造上的不少短板,也带动了我们部分技术的飞跃;穿孔卡计算机涉及到前数字时代方方面面的工业技术,同样会遇到这样那样的问题,把这些难关一一攻克,也就标志着咱们的工业化水平就又上了一个新台阶。”

……

冯诺边记边点头,虽然这些指示在技术上作用不大,不过可以写一篇新闻发到《临高时报》上去。

最终,打孔机的方案还是确定为全机械结构,由于冯诺提出的3孔双列的汉字编码方案暂时延缓,打孔机现在可以已完全仿制1923年的IBM-011型数字打孔机。该打孔机早期适用于45列卡,1929年80列标准IBM卡确定之后,又重新设计为能够适应标准IBM卡的方案。该机型是没有英文字母的打孔的,是全数字的打印机。有14个按键,分别为0-9,X,Y,S,R,其中12个键分别在0-9,11(X),12(Y)行上打孔,S为空列不打孔(Space),R为结束打孔(Release)。

IBM-011体积较小,结构实现容易,针对眼下的人口普查需求也足够用了。唯一遗憾的是没有实物仿制,冯诺在数据中心翻箱倒柜找出了一些技术参数和几张模糊不清的照片。好在原理比较清楚,机械口的元老们又从打字机项目组取了几次经,总算把图纸定了下来。

“接下来就没什么自己能插手的事了,不过还是得盯紧点这个项目,这可是自己转型的关键作品。”冯诺一边例行检查计算中心的运行情况,一边琢磨。

蜂鸣器的响声打断了冯诺的出神,他浑身一哆嗦,果然,又一块内存失效了,这一下,仅剩的两个胖节点,也有一个称不上胖了。

“这个月好像没什么用户申请用计算中心,应该可以考虑再缩减一下规模,省下来设备未来说不定还能用得上。”冯诺喃喃自语。他想喊冯珊给自己拿份提案表来,又想起来她今天去找几个归化民技术员开“项目协调会”去了。由于前段时间跟冯诺往机械口跑得很勤,最终冯珊没有和钟小英一样选择基础科学的题目,而是选了合金热加工性质研究方面的课题报上去获批了。

冯诺自己拿了一张表格,开始填写起来。

“关于计算中心设备使用率较低与进一步封存的建议”。

时间进入1635年4月,打孔机彻底定型并开始投产。月中,计算中心宣布无限期关停一半刀片和1个仅有的胖节点,仅余6台刀片机和2个不太胖的节点采用4台一组轮流开机的策略继续运行,其余所有设备立即清拆封存。数据中心则维持与大图书馆那边的镜像轮流开机的策略不变。随着资料纸质化与中文化的进行,想必离关停的日子也不远了。

冯诺走在路上,他一早接到印刷厂的电话,通知他参加穿孔卡印刷技术改进讨论会,穿孔卡上数字的印刷精度一直不太理想,只能凑合,而用纸币印刷技术又嫌成本太高,这次据说有所突破。“卡片这一关过去了,从6月份开始总算能先开始进行人口普查了,这个项目也算是初见成效,以后继续钓鱼也方便。自己虽然只是没毕业的博士,不过这一招以前老板可是百试百灵。”他松了一口气,有些猥琐地想着。

冯诺在旧时空虽然也姓冯,但是并不叫冯诺。一边走着,他忽然想起来自己穿越时报了这个名字,是想着,在新时空,即使比不上冯·诺依曼,也要至少达到其一半。

这才是个开头,他想,觉得朝阳稍微有点刺眼。

目录
新书推荐: 某天邪恶女巫闯进我的人生 离宗后,师兄们忏悔痛哭 恶女修仙,全族祭天 被挖眼吸血!异能大佬掀翻整个大陆 克系黑龙的自我修养 被捉奸的我,成了正主 失业后,我被神豪养成了顶级女神 气死嫡姐,你不要的世子娶我后登基了 嫂子拼命保护我,却不知道我最强 你迎娶平妻?我带崽入宫当皇后
返回顶部