在 PHP 中用描点法“绘制”中文

  •   2009-08-01/08:13
  • 前言:
    现在,越来越多的人喜欢上网了,越来越多的人拥有了自己的个人主页。随着各种自动化软件工具的出现,制作网页越来越简单。但,由于特效随处可得,创新的东西,越来越少。说不定,哪天,你会发现某个网站上的计数器和自己的一模一样。网页越做越老练。网页上的东西,也越来越多,越来越丰富。
    设问:
    • 在网页上,如果我要添加一个计数器:
      以前,那就去空间提供商那里要个链接,或其他地方去复制个地址,但这一些,总归是别人做的,好不好,你是没有太多的发言权的,只能一个一个地找。
    • 在网页上,我要将一些信息发布出去:
      假如信息是文本,做一个新页面,加个链接;
      是数据,做一个新页面,加个链接:
      可要是这些数据经常更新,甚至,每小时、每分钟,都可能会改变,你是否愿意守在电脑前,不停修改、上传呢?(咱可不是商业网站,没有人愿意为你而烧钱。)
      而留言板、聊天室、论坛,这些,决不是单靠HTML和JAVASCRIPT就能搞定的。

    为了实现更多的自动控制,可以使用CGI(Common Gateway Interface)程序来实现这些功能。

    软件需求:
    PHP:GD Library
    配置支持PHP的服务器。我用OmniHTTPd Professional

    对于计数器和实时数据统计、发布,我们可以用图片来完成。在图片中输出文字。
    在PHP中,要创建一个图片,并在上面显示点内容,基本步骤如下:

    <?php
    //http头,告诉浏览器,这是一个GIF图片
    header ("Content-type: image/gif");
    // 要画画,先要有花布不是?创建一个400×300调色板图像
    $im = imagecreate (400, 300);
    $black = imagecolorallocate ($im, 0, 0, 0);
    // 默认黑色背景。
    //(默认,是指第一个定义的颜色。如果在此行代码前面定义了另一个颜色,那么,最先定义的那个,就是默认背景颜色。
    $red = imagecolorallocate ($im, 255, 0, 0);
    //红色。如果这两行交换,你会发现背景是红色,文字是黑色。
    $string="1234567890";
    // 要绘制的字符
    imagestring ($im,12,10,10,$string,$red);
    //在(10,10)开始绘制字符串
    imagepng ($im);
    // 以png格式输出,也可以用imagejpeg($im);或magegif($im);但后者,如果GD版本高于1.6,就不能用了。
    imagedestroy ($im);
    // 结束,清除所有占用的内存资源
    ?>


    上面示例,在400×300的图片上,自点(10,10)开始,绘制12磅的"1234567890"。你有没有注意到这张图片的大小是:251字节!你也可以试试其他的输出格式。
    图片的大小,与图片中非背景象素点数有关,跟输出多少象素无关。

    然而,有一个问题。
    你可以用imagestring()输出如下的信息:
    imagestring($im,1,0,0,"abcdefghijklmnopqrstuvwxyz0123456789~!@#$%^&*()_+{}|:"<>?[]';,./",$red);
    可是,你无法正确输出中文!!!
    imagestring($im,1,0,0,"啊",$red);
    你看到的,决不是中文!!而是乱码。
    PHP默认的字符集是UTF-8,而简体中文是GB2312。

    如何解决?!
    为了解决这个问题,你可以让PHP加载扩展模块php_iconv.dll(UNIT下的后缀名是.SO),不过,有时候,可能不能正常工作。本来,我要把一段测试代码放上来,可这次,怎么弄都没有成功。为了避免错误,我还是不把它们放上来了。
    但,最致命的,如果你的空间服务商关闭了该扩展模块,或者,甚至禁止了加载模块的DL()函数,那,你就只能跟中文BYE-BYE了。
    还好,还有其他办法。
    可以通过字符映射,将预先转换好的码表中字符输出来。但,你需要一张码表!
    或者,手工绘制每一个中文的每一个点!感觉怎么样?!

    好,来吧,我们一起来画字!

    画字,首先要知道怎么画。
    初中的简单函数,学过吧?要画出函数的图形,做过吧?算出某点的坐标,然后连接两相邻点。这种方法,叫描点法。
    我们要做的,是尽量多地将点算出来,然后在相应坐标显示出来。
    你是否听说过点阵打印机、点阵汉字?
    在输出汉字时,它们是用一个个点来表示的。

    在某个坐标上显示一个某种颜色的点的函数是:
    int imagesetpixel ( resource image, int x, int y, int color)
    假定我要在坐标(100,100)处显示一个白色的点,那么,只需如下代码:

    <?php
      header ("Content-type: image/gif");
      $image = imagecreate (400, 300);
      $black = imagecolorallocate ($image, 0, 0, 0);
      $white = imagecolorallocate ($image, 255, 255, 255);          // 定义白色
     
    imagesetpixel ( $image, 100, 100, $white);
      imagepng ($image);
      imagedestroy ($image);
    ?>


    也就是说,我们只要获取某个汉字的所有点的信息,我们就能够通过这个函数,输出那个汉字。

    在文件chs16.fon里,保存的,是国标区位码表(国家标准信息交换用汉字编码基本字符集GB-2312)。它是汉字的点阵字库。(WIN98系统中,此文件在c:windowscommand下。如果你要把它放在UNIX系统下使用,请注意大小写。如果没有,你可以在文末找到链接。)
    它是MSDOS时代的,但,好东西,还是应该拿出来一用的。

    从chs16.fon里,我们可以读取汉字的点阵数据。每个汉字,都是由16×16个点构成的。笔划走过的地方,点的值为1,否则为0;每个点占用一个位,每8个点构成一个字节。那么,一个汉字,就需要(16×16÷8=32)字节。

    下面这个实例,是为了说明字符点阵的表示方法。
    这里,定义了一个8×8的矩阵,显示了一个字母C,白色的方块用0表示,黑色方块用1表示,那么,这八行图形的代码分别是:

    二进制表示

    十六进制表示

    0

    00000000

    0x00

    1

    00111110

    0x3E

    2

    01110000

    0xE0

    3

    01110000

    0xE0

    4

    01110000

    0xE0

    5

    01110000

    0xE0

    6

    00111110

    0x3E

    7

    00000000

    0x00

      
    要输出这些点的话,就需要先画第一行,然后第二行、第三行……到最后一行。
    用一个循环:
      for($hang=0;$hang<8;$hang++)
    在每一行中,有八个格子,需要分别绘制,从第一个,然后第二个、第三个……到最后一个。
    用一个循环:
      for($gezi=0;$gezi<8;$gezi++)
    两个循环联列:
      for($hang=0;$hang<8;$hang++)
    for($gezi=0;$gezi<8;$gezi++)
    { //在这里,我们就能输出点了。
          imagesetpixel ( $image, $gezi, $hang, $color);
    }

    但,我们如何知道到哪里去读某个汉字的点阵数据呢?

    一般的字符,比如ASCII码,是用数字0--127(即二进制00000000到01111111)来表示,而中文,则是用两个高位为1的字节(100000000 100000000)表示。如:  半角字符"A",机内码为 (01000001)(它实际上是ASCII码值)。
    下面,让我们打开"字符映射表"看看吧。如果你为了节省磁盘,没有安装,那就装一下,不大。如果不会安装,那你就接下去看我乱侃吧。
    在字符映射表里,字体选择"楷体_GB2312",点击"特殊符号",这时,你可以看到国标区位码表,从字符(10110000 10100001)开始,一直到(10011111 11111111)。
        全角字符"A",机内码为:(10100011 11000001)(它实际是两个高位为1的ASCII码)。
        中文"啊"的机内码,是(10110000 10100001);
    在GB-2312字符集中,"啊"在表中位置是第16区第1位,这个坐标(16,1),用二进制表示,就是(00010000,00000001)。这,就是"啊"的区位码。
    请看:

    中文字符:   啊
    机内码:    (10110000 10100001)
    区位码:    (00010000,00000001)
    相差:      (10100000,10100000)

    所以,
        区位码与机内码的换算公式为 【区位码】+(10100000 10100000)=【机内码】。即:
        区位码0 + (10100000) = 机内码0;
        区位码1 + (10100000) = 机内码1;
    这样的话,点阵数据,就可以通过汉字"机内码"-> "区位码"进行索引、查找。

    前面已经讲了一个汉字,在表中要占用32字节,所以,我们定义了一个含有32个元素的数组:
           $buffer=array(0,0,0,0,0,
                        0,0,0,0,0,
                        0,0,0,0,0,
                        0,0,0,0,0,
                        0,0,0,0,0,
                        0,0,0,0,0,
                        0,0);
        用来保存从字库读出的32个字节数据。

    接下来的问题,某一个字符,到底保存在文件的什么位置呢?

    由于一个汉字用了32个字节,而GB-2312区位码表表有94行、94列,那么,只要知道该字符在表中是第几个,再乘以32就行了。
    所以定义偏移量:
            $offset=(94*($qh-1)+($wh-1))*32;
        $qh表示区(qu)、$wh表示位(wei);减1,是因为PHP从0开始计数。
    位置找到,就只需要用fseek()函数定到码表的这个位置,然后读32字节到$buffer就行了。
    另外,由于中文是由两个字节组成,而前面给出的点阵示例是8位,一个字节,所以,画点的代码要修改一下:
    for($hang=0;$hang<16;$hang++)
    for($j=0;$j<2;$j++)           //因为是两个字节,所以插入一个循环
    for($gezi=0;$gezi<8;$gezi++)
    {
           imagesetpixel ( $image, $gezi +8*$j, $hang , $color);
    }

    好,我们开始编程吧!


    /*************************************
    *     文件名:'draw1.0.inc.php
    **    中文显示点阵输出   version 1.0
    **    只提供简单的操作:输出默认大小的纯中文字符串到图片的坐标(0,0)上
    **    更多功能,请见下一版本。
    *
    ****************************************/

    function draw($image,$string,$color)
    {
       $fp=fopen("chs16.fon","rb");//二进制方式读点阵字库chs16.fon
      
    if (!feof($fp))//如果文件指针到了文件末尾,退出,不要忘记关闭文件
      
    {
          while($string)//当字符串不为0
         
    {
             $qh=ord(substr($string,0,1))-0xa0;
          $wh=ord(substr($string,1,2))-0xa0;
    /* 这两行代码,其实是获取一个中文的机内码。
      substr($string,0,1);是从$string中获取第一个字节,然后,通过ord();将这个字符转换为整数。(由于PHP不支持无符号整数,所以没有这一步转换的话,你就只能得到一个0。)在转换为整数之后,就能进行计算了。机内码减去0xa0(10100000),就得到了区位码。
    substr($string,1,2);是获取$string中的第二个字节。*/

             $offset=(94*($qh-1)+($wh-1))*32;
    /*得到了汉字的区位值后,就开始计算偏移量了。*/
         fseek($fp,$offset,SEEK_SET);
    /*在字库文件$fp中,将文件指针定位到偏移量。*/
             $buffer=preg_split('//', fread($fp,32), -1, PREG_SPLIT_NO_EMPTY);
    /* fread($fp,32);是从$fp中读取32个字节数据,然后通过preg_split();分配到数组$buffer中。preg_split();是一个支持正则表达的函数。关于正则表达式,我正在学习中。为什么这样用,我也不知道。PHP手册里有本实例。*/
            for($i=0;$i<16;$i++)              //点阵的行数:16 列数也应该是16
          
    for($j=0;$j<2;$j++)             //因为是两个字节,那么,就要一个一个地画了
           
    for($k=0;$k<8;$k++)          //每个字节,都有8个点的数据
         
    if(((ord($buffer[$i*2+$j])>>(7-$k))&0x01))//如果这个点的值为1,输出;否则,没有
         
    {
             imagesetpixel($image,$x+8*$j+$k, $i, $color);
                 }
          $string=substr($string,2); //中文由两个字节表示,所以,输出一个汉字后,就要去掉两个字节。
          $x=24; //一个汉字输出结束,空开一点,给下一个汉字。因为这个汉字是16×16点,那么,$x的值设为16就够了。但太挤了不是
         }
      }
      fclose($fp);
     
    }

    下面,我给出一个测试实例:


    <?php
    header ("Content-type: image/gif");
    include 'draw1.0.inc.php';
    $im = imagecreate (400, 300);
    $black = imagecolorallocate ($im, 0, 0, 0);
    $string="中文";
    drawer($im,$string);
    imagepng ($im);
    imagedestroy ($im);
    ?>


    对于这个函数,我们还可以进行扩充,以实现不同的效果。





    一个实时用户留言板留言数量统计表实例:

    作者联系方式:
    Homepage:
    E-mail:


    评论 {{userinfo.comments}}

    {{money}}

    {{question.question}}

    A {{question.A}}
    B {{question.B}}
    C {{question.C}}
    D {{question.D}}
    提交

    驱动号 更多