php过滤ascii控制字符】的更多相关文章

还记得以前在工作中,将爬来的其它网站的数据导到xml.但是会遇到一个问题:即网页会有ascII的控制字符. 一开始以为是别人为了防止采集而加入的,然后发现一个就往过滤表里加一个.直到慢慢发现,他们都是ascii表里的字符. 找到原因了,就好解决了. /** * 根据ascii码过滤控制字符 * @param type $string */ public static function special_filter($string) { if(!$string) return ''; $new_s…
今天产品部同事报告了一个BUG,经过调试发现,由于用户输入的字符串中,包含字符0x1E, 也就是”记录分隔符”(Record Separator, Notepad++ 显示为[RS]),导致JavaScript XML解析遭遇错误.于是就想在字符串中过滤掉这些没多大用途的字符,同时又要保留部分常用的字符,例如换行,回车和水平制表符.于是写了下面一个 PHP 函数: /** * 清理字符串中的部分不可见控制字符 * * @param string $string 待处理字符串 * @return…
#include <stdio.h> #include <string.h> /* 1.以字符串作为参数 2.找出ASCII在1~127范围内的字符 3.去掉重复字符 */ int GetString(char *str); int main(int argc, char *argv[]) { char ch[] = "abcd123123123123123123"; ; num = GetString(ch); printf("num = %d\n&…
   ASCII字符集中的功能/控制字符     Function/Control Code/Character in ASCII Version: 2011-02-15 Author: green-waste (at) 163.com [什么是 Function Code 功能码或  Function Character 功能字符] ASCII 字符集,大家都知道吧,最基本的包含了 128 个字符.其中前 32 个, 0-31 ,即 0x00-0x1F ,都是不可见字符.这些字符,就叫做控…
如果在excel下的单元格写入公式:=“国际经济与贸易”&CHAR(10)&"401班"&CHAR(10)&"A组".则出现: 国际经济与贸易   401班   A组 是因为使用了CHAR()函数,它返回ASCII 字符集,CHAR(10)是换行符,所以学习一下ASCII字符集中的功能/控制字符: ASCII 字符集,最基本的包含了 128 个字符.其中前 32 个, 0-31 ,即 0x00-0x1F ,都是不可见字符.这些字符,就…
十进制 十六进制 控制字符 转义字符 说明 Ctrl + 下列字母 0 00 NUL \0 Null character(空字符) @ 1 01 SOH   Start of Header(标题開始) A 2 02 STX   Start of Text(正文開始) B 3 03 ETX   End of Text(正文结束) C 4 04 EOT   End of Transmission(传输结束) D 5 05 ENQ   Enquiry(请求) E 6 06 ACK   Acknowle…
<?php /** * global.func.php 公共函数库 */ /** * 返回经addslashes处理过的字符串或数组 * @param $string 需要处理的字符串或数组 * @return mixed */ function new_addslashes($string){ if(!is_array($string)) return addslashes($string); foreach($string as $key => $val) $string[$key] =…
十六进制代码 MCS 字符或缩写 DEC 多国字符名 ASCII 控制字符 1 00 NUL 空字符 01 SOH 标题起始 (Ctrl/A) 02 STX 文本起始 (Ctrl/B) 03 ETX 文本结束 (Ctrl/C) 04 EOT 传输结束 (Ctrl/D) 05 ENQ 询问 (Ctrl/E) 06 ACK 认可 (Ctrl/F) 07 BEL 铃 (Ctrl/G) 08 BS 退格 (Ctrl/H) 09 HT 水平制表栏 (Ctrl/I) 0A LF 换行 (Ctrl/J) 0B…
ASCII控制字符 二进制 十进制 十六进制 缩写 可以显示的表示法 名称/意义 0000 0000 0 00 NUL ␀ 空字符(Null) 0000 0001 1 01 SOH ␁ 标题开始 0000 0010 2 02 STX ␂ 本文开始 0000 0011 3 03 ETX ␃ 本文结束 0000 0100 4 04 EOT ␄ 传输结束 0000 0101 5 05 ENQ ␅ 请求 0000 0110 6 06 ACK ␆ 确认回应 0000 0111 7 07 BEL ␇ 响铃…
文章原地址: http://www.jb51.net/tools/zhengze.html <正则表达式30分钟入门教程> 其中有几个地方可以有笔记: \s 匹配任意的空白符 \b 匹配单词的开始或结束 {n} 重复n次 {n,} 重复n次或更多次 {n,m} 重复n到m次 \S 匹配任意不是空白符的字符 [^aeiou] 匹配除了aeiou这几个字母以外的任意字符 捕获(exp) 匹配exp,并捕获文本到自动命名的组里 (?<name>exp) 匹配exp,并捕获文本到名称为na…