PHP实现网页内容html标签补全和过滤的方法小结【2种方法】
author:一佰互联 2019-04-26   click:178

本文实例讲述了PHP实现网页内容html标签补全和过滤的方法。分享给大家供大家参考,具体如下:

如果你的网页内容的html标签显示不全,有些表格标签不完整而导致页面混乱,或者把你的内容之外的局部html页面给包含进去了,我们可以写个函数方法来补全html标签以及过滤掉无用的html标签.

php使HTML标签自动补全,闭合,过滤函数方法一:

代码:

function closetags($html) { preg_match_all("#<(?!meta|img|br|hr|input)([a-z]+)(?: .*)?(?<![/|/ ])>#iU", $html, $result); $openedtags = $result[1]; preg_match_all("#</([a-z]+)>#iU", $html, $result); $closedtags = $result[1]; $len_opened = count($openedtags); if (count($closedtags) == $len_opened) {    return $html; } $openedtags = array_reverse($openedtags); for ($i=0; $i < $len_opened; $i++) {    if (!in_array($openedtags[$i], $closedtags)) {     $html .= "</".$openedtags[$i].">";    }else {     unset($closedtags[array_search($openedtags[$i], $closedtags)]);    } } return $html;}

closetags()解析:

array_reverse() : 此函数将原数组中的元素顺序翻转,创建新的数组并返回。如果第二个参数指定为 true,则元素的键名保持不变,否则键名将丢失。

array_search() : array_search(value,array,strict),此函数与in_array()一样在数组中查找一个键值。如果找到了该值,匹配元素的键名会被返回。如果没找到,则返回 false。 如果第三个参数strict被指定为 true,则只有在数据类型和值都一致时才返回相应元素的键名。

php使HTML标签自动补全,闭合,过滤函数方法二:

function checkhtml($html) {  $html = stripslashes($html);    preg_match_all("/<([^<]+)>/is", $html, $ms);    $searchs[] = "<";    $replaces[] = "<";    $searchs[] = ">";    $replaces[] = ">";    if($ms[1]) {      $allowtags = "img|font|div|table|tbody|tr|td|th|br|p|b|strong|i|u|em|span|ol|ul|li";//允许的标签      $ms[1] = array_unique($ms[1]);      foreach ($ms[1] as $value) {        $searchs[] = "<".$value.">";        $value = shtmlspecialchars($value);        $value = str_replace(array("\","/*"), array(".","/."), $value);        $value = preg_replace(array("/(javascript|script|eval|behaviour|expression)/i", "/(s+|"|")on/i"), array(".", " ."), $value);        if(!preg_match("/^[/|s]?($allowtags)(s+|$)/is", $value)) {          $value = "";        }        $replaces[] = empty($value)?"":"<".str_replace(""", """, $value).">";      }    }    $html = str_replace($searchs, $replaces, $html);  return $html;}//取消HTML代码function shtmlspecialchars($string) {  if(is_array($string)) {    foreach($string as $key => $val) {      $string[$key] = shtmlspecialchars($val);    }  } else {    $string = preg_replace("/&((#(d{3,5}|x[a-fA-F0-9]{4})|[a-zA-Z][a-z0-9]{2,5});)/", "&\1",      str_replace(array("&", """, "<", ">"), array("&", """, "<", ">"), $string));  }  return $string;}

checkhtml($html)解析:

stripslashes():函数删除由addslashes()函数添加的反斜杠。该函数用于清理从数据库或HTML表单中取回的数据。

更多关于PHP相关内容感兴趣的读者可查看本站专题:《PHP数据结构与算法教程》、《php程序设计算法总结》、《php排序算法总结》、《PHP常用遍历算法与技巧总结》、《PHP数学运算技巧总结》、《PHP数组(Array)操作技巧大全》、《php字符串(string)用法总结》及《php常见数据库操作技巧汇总》

希望本文所述对大家PHP程序设计有所帮助。