|
PHP聊天室代码分析 ~ admin
从前有一个相当流行的web聊天室,叫做Star Trekker 聊天室。我能够来到
这个聊天室要感谢我的一个朋友,并且即使Star Trekker的聊友们几乎与我不是 同一个圈中的,但是我发现对于他们的大部分人来说,都很友好和有意思。但是 当Star Trekker关闭之后,这不得不谢谢运行在后台的Perl了,是它吞掉了服务 器的资源,所以这些快乐和友善的人们不得不离开,无处可去了。我有幸在那段 时间开张了自已的仿Star Trekker的聊天室,并且开始设法与许多原来的Trekke r的那些无家可归的聊友进行联系。出于对 Perl所引起的资源消耗问题的警惕, 当一个朋友向我推荐PHP时,我非常的高兴。 这个经过精心设计的web聊天室使用了从表单传递过来的变量,并且把它们处 理为HTML ,然后将其写入文件。把表单和信息文件放在一个框架中,你可以看到 它与一个叫BeSeen的聊天室很象。当然它的好处在于,我们的聊天室比起它的Be Seen堂兄弟来说要聪明一些。 上面就是基本的用于输入的表单。你可能想把它弄得更美观一些,但是不管 出于什么目的,这个就是你要处理的。它发送两个变量给chat.php3,分别叫做$ name和$message。 不过,在处理那些变量之前,我们需要从消息文件中把当前的内容取出来, 否则在一个时间里我们只能看到一条消息了。几乎没有一个方法可以管理对话。 只有象我一样对自已的消息文件的结构很熟悉,我就知道每一条消息都以一个回 车符结束。这就是说,可以使用file()函数来将消息文件读到一个数组中去。 消息文件有12行。在12行中,第1行为头信息,第2行到11行为旧的消息,第 12行包含了我的脚标。 我最感兴趣的是得到一个能够包含所有那些旧消息的字符串。 // 把文件读到一个数组中 $message_array = file(messages.html); // 编辑字符串 for ($counter = 1; $counter < 10; $counter++) { $old_messages .= $message_array[$counter]; } ?> 在处理字符串的时候,我将for循环的$counter初始化为1而不是0。这是因为 我知道$message_array 数组的第0个元素包含的是我的头信息,我不需要它。而 且,通过设置循环结束条件为$counter < 10,意思是只有数组中1到9的元素被读 到字符串中。对于剩下的两个元素,第11个包含我的脚标,第10个包含的是最旧 的消息。这两个我都想删除,因为在任何时刻我只让屏幕显示10条消息。修改$c ounter < 10 表达式,可以允许你改变所包含消息的数量。 现在已经有了旧的消息,接着我想生成新的消息。我们已经有了两个变量: $name 和$message,所以写出一个新的消息就很容易了。 n; ?> 我们就快要写好消息文件了。剩下需要的就是头信息和脚标。先加入简单的 头部信息: // 除了在字符串末尾有回车符,其它地方不能有回车符,这一点很重要。 // 要把所有的头信息放在一样。 $header = n; ?> 我们想让消息屏幕能够自动刷新,那么人们就可以看到新的贴子了。我没有 使用JavaScript,而是采用了META标记进行刷新,主要是因为它可能更容易被客 户端支持。我也不想让搜索引擎对我的消息文件进行索引。所以重新定义头信息 为: $header = . . n; ?> 在文件的脚标处,我一般是放置一小段版权信息,还有与打开的头信息对应 的结束标记。 $footer = . ?> 将版权信息用包起来表示只有被选中它才会被看见 ,因为它的颜色与背景色#000000一样。这样做的目的只是为了不让它影响显示。 现在我们终于有了写新文件所需的所有东西了: // 打开文件,并且将文件长度截为0 $open_file = fopen(messages.html, w); // 写入文件的头信息 fputs($open_file, $header); // 新的一行 // (使用stripSlashes,因为我们不想让所有的转义字符出现在消息文件中) fputs($open_file, stripslashes($new_message)); // 旧的行 fputs($open_file, $old_messages); // 脚标 fputs($open_file, $footer); // 关闭文件 fclose($open_file); ?> 这样,我们现在有一个非常非常基础的web聊天程序了。我在http://www.ph oenix50.com/chat/运行着一个与此非常相似的系统,尽管它更加“久经事故”。 让我们看一下它的一些特点吧。 我们向表单中增加了一个新的输入,意味着在脚本中有了一个好的新变量。 我们象以前一样读出旧的消息,但是在编辑新的消息时,多用了一些HTML标记。 $new_message = $name : $message n; ?> 一旦我们考虑到了这些,就会得到更多的赞扬。 $time = date(H:i); $new_message = $name. ($time) : $message n; ?> 在我的聊天室的正式成员可以享受到的功能是在他们的消息上显示邮件和UR L的链接图标。又有两个表单输入被组合在一起,链接的处理如下: if($url) $link_html .= . 2; if($mail) $link_html .= . *; $new_message = $name. $link_html ($time) : $message n; ?> 再一次,我们可以就做到这里了,但是这里存在着安全隐患。用什么方法可 以阻止某些人在输入框中输入一些恶心的HTML标记呢?一小段JavaScript呢?一 小段VBScript呢?甚至简单的一个5000K的JPEG 图片也会带来灾难。每8 秒钟在 只有老天爷才知道会有多少来自四面八方的人们的屏幕上刷新,可能会耗尽你的 带宽(这可不是我们想要的)。我们应该删除所有的HTML和PHP元素,可以使用s trip_tags( )函数,但是我还想让聊天者在他们的贴子中可以使用一些基本的HT ML标记。基本的元素象,,和,它们可以用于修饰消息。 几乎有两年的时间,我使用的是复杂的regex(正规表达式)系列语句来处理恶 心的HTML 标记。然而我发现要不时地加入新的过滤,直到对于过滤的处理占距了 我的大部分代码!就在我因为这些低效的代码而感到失落的时候,我再一次被一 个朋友拯救了,他建议我换个角度来解决这个问题。不是告诉脚本哪些HTML可以 用,而是告诉它哪些不能用。 htmlspecialchars()是一个不常用的PHP函数。它将某些字符替换成它们的H TML特殊实体。所以变成",&变成&,<变成<,>变成>。通过ht mlspecialchars()函数对$new_message进行处理,我将... , $message); ?> 等等这些。还有更聪明的办法是使用eregi_replace(),但是我不想让问题复 杂化。 我们必须保证让$name,$color,$url和$mail也通过这个过滤,否则不怀好 意的用户可以在那里输入代码。为了减清你的工作,将过滤部分分离开放入一个 函数中。 $name = filterHTML($name); $message = filterHTML($message); $color = filterHTML($color); $url = filterHTML($url); $mail = filterHTML($mail); ?> 最后一件事情我们要记下来的是如何对付那些爱惹麻烦的人。如果你决定做 一个受欢迎的聊天室,这是一个要注意的问题。这是令人悲衰的事实,我们不得 不去面对--人们经常变得古怪。因为如此,我们不得不确保只有正常的那类人可 以进入我们的聊天室。 一种办法就是设计一个登录系统。在一个MySQL数据库中保存用户名及口令, 并且要求用户在能够操作你的聊天室之前先要注册。另一种办法就是记录爱惹麻 烦的人的IP地址,并且阻止那个IP的发言。 对于第二个系统在某种情况下有缺陷,就是对于能够在许多代理服务器上切 换他们的IP的那些事端制造者不适用。并且由于大部分的ISP所分配的是动态的I P 地址,甚至比较愚蠢的人也可以只是重新连接就可以操作聊天室了。 大部分的“偶而”惹麻烦的人不会影响所有的人而只是使用少数人感到“紧 张”。一但被“扁(ban)”了,他们不会再回来惹麻烦。 所以我们将被扁的IP地址记录在一个叫作banned.ban的文件里。每一个IP都 以一个回车符结束,所以象以前一样,我们可以使用file()函数将文件内容读到 一个数组中。 $banned_array = file(banned.ban); 现在我们有了需要通过$REMOTE_ADDR变量来交叉引用的文件,这样我们可以 区分出想要发贴的用户是否已经被扁或没有被扁。很简单: for ($counter=0;$counter print(. You have been banned from this chat); exit; } } ?> exit命令将立即停止脚本的执行。在开始对传递过来的变量执行处理之前, 插入对被扁用户的检查,这样被扁用户就不能使用聊天室了。 比较好的解决在某些情况下动态IP地址的问题的一个意见就是,检查IP地址 块的所属范围。一个简单的函数可以容易地实现它。 function makeMask($ip) { // remember to escape the . so PHP doesn't think it's a concatenat ion $ip_array = explode(., $ip); $ip_mask = $ip_array[0].$ip_array[1].$ip_array[2]; return $ip_mask; } ?> 然后我们把循环中的if替换成 for ($counter=0;$counter print(. You have been banned from this chat); exit; } } ?> 我们有了针对动态IP地址的保护措施。 最后我们需要一种方法最先得到惹麻烦的IP。我的实现是将$name和$REMOTE _ADDR记录到一个名为iplist.html的文件中。对于一个分离的,秘密的URL,我可 以在浏览消息的同时监控IP地址。这可以增加一些意外的好处,就是能够发现假 冒者--在这些地方最常犯的“罪”。 iplist.html与messages.html的创建方法基本上一样。首先将当前的值从ip list.html中取出来,我们剥离掉头信息,脚标和旧的IP记录,然后创建一个新的 记录,新的头信息,新的脚标。为了让布局更清楚,我使用了表格。 $header = $new_ip = $name | $REMOTE_ADDR | $ip_array = file(iplist.html); for ($counter = 1; $counter < 20; $counter++) $old_ips.= $ip_array[$counter]; ?> 简单地把内容写入磁盘与对message文件所做的一样,这样我们就有了一个w eb聊天室。比Java有更好的跨越平台的兼容性,并且除了一个web浏览器什么都不 需要了--我听说甚至Dreamcast就是这样工作的! 有一些东西你可能想试着自已做一下,包括合并一些常用代码片段为函数, 编写一个可以自动增加惹麻烦的人到被扁列表中的脚本和编写一个regex表达式, 可以扫描消息正文中的URL和e-mail,并将之自动转换成链接(象Outlook Expre ss 和ICQ做的那样)。 试一试,体会一下乐趣,得到一些经验。这就是在PHP方面我是如何开始的并 且现在我已经以它为职业了。祝聊天快乐! 来自:http://phprecord.126.com 原文:http://www.phpbuilder.com 作者:Mike Hall 译者:limodou ----------------------------------------------------------------- limodou 提供给咱们源源不断的 freshmeat 呀. 向 limodou 同学致敬! // jackyz 站的笔直,向斜上方30度伸直右臂,高喊口号:嗨.希特勒. // .... :p ----------------------------------------------------------------- 评注: 这个聊天室对于那些想要开始学习php编程的同学们而言,很有参考价值.实际上w eb聊天室大致上的原理就是这个样子的.所不同的大概是一些处理上的变通(或者 是干脆下到底层去写).对很多高手而言,可能对它采用的写文件来共享信息的方 法觉得很为不齿,不过,如果改成使用 share memory 应该不是什么困难的事情.它 的刷新方法是 client pull (用Meta标签),其实,对于php而言,这样子的刷新方式 或许是最适合的.毕竟,php所处的应用层次比较高,不是很适于处理通信层次的东 西.况且,如果用其他的处理方法(NT 下的 RAMDisk?或许.),速度还不一定会很慢 呢.如果能再结合前面的 php-javascript 减少数据的流量,那么...呵呵,哪位有 心人试试看呢. |