美学原理[PHP源码阅读]strpos、strstr和stripos、stristr函数

自以github有针对PHP源码更详细的诠释。感兴趣的得扫描一下,给个star。PHP5.4源码注解。足由此commit记录翻看已长的注解。

strpos

mixed strpos ( string $haystack, mixed $needle [, int $offset = 0 ] )

倘若offset指定了,查找会从offset的岗位上马。offset不克为负数。

回去needle第一不行面世于haystack的职。如果以haystack中寻觅不至needle,则回FALSE。

needle,如果needle不是字符串,它会为转换成为整型数值并赋值为该数值的ASCII字符。请看下例子。

例子

$str = "hello";
$pos = strpos($str, 111);
// 111的ASCII值是o,因此$pos = 4

strpos核心源码

if (Z_TYPE_P(needle) == IS_STRING) {
     if (!Z_STRLEN_P(needle)) {
          php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
          RETURN_FALSE;
     }

     // 调用php_memnstr函数查找needle
     found = php_memnstr(haystack + offset,
                            Z_STRVAL_P(needle),
                            Z_STRLEN_P(needle),
                            haystack + haystack_len);
 } else {
      // 如果不是字符串,转换成数字并赋值为该数字的ASCII字符。
      if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
          RETURN_FALSE;
      }
      //设置结束字符
      needle_char[1] = 0;
      found = php_memnstr(haystack + offset,
                        needle_char,
                        1,
                        haystack + haystack_len);
}

来某些设留意的是,如果needle不是字符串的话,会调用php_needle_char函数将needle转成整型数字并易为夫ASCII值。

摸函数

函数最后回来的凡found,php_memnstr函数实现了查找的方式。那么还持续看php_memnstr函数做了啊:

#define php_memnstr zend_memnstr

php_memnstr是函数zend_memnstr的宏定义,查看zend_memnstr函数如下:

static inline char *
zend_memnstr(char *haystack, char *needle, int needle_len, char *end)
{
    char *p = haystack;
    char ne = needle[needle_len-1];
    if (needle_len == 1) {
        return (char *)memchr(p, *needle, (end-p));
    }

    if (needle_len > end-haystack) {
        return NULL;
    }

    // 第一个优化,只查找end - needle_len次
    end -= needle_len;

    while (p <= end) {
        // 第二个优化,先判断字符串的开头和结尾是否一样再判断整个字符串
        if ((p = (char *)memchr(p, *needle, (end-p+1))) && ne == p[needle_len-1]) {
            if (!memcmp(needle, p, needle_len-1)) {
                return p;
            }
        }

        if (p == NULL) {
            return NULL;
        }

        p++;
    }

    return NULL;
}

end原来指向\0字符,然后end –
needle_len,如果后面有凡是needle,就不用继续移动,因此只有比较end –
needle_len次。

strstr

string strstr ( string $haystack, mixed $needle [, bool $before_needle = false ] )

归来needle在haystack中首先赖出现的职位及了之字符串。

斯函数的区别轻重缓急写的。

倘needle在haystack中莫在,返回FALSE。

如果before_needle为true,则归haystack中needle在haystack第一次等面世的职位之前的字符串。

strstr核心源码

if (found) {
        // 计算出found的位置
        found_offset = found - haystack;
        if (part) {
            RETURN_STRINGL(haystack, found_offset, 1);
        } else {
            RETURN_STRINGL(found, haystack_len - found_offset, 1);
        }
    }

strstr函数的前面半有以及strpos类似,区别在于strstr函数在找到位置后,需要返回haystack部分的字符串。part变量就是调用strstr函数时传递的before_needle变量。

stripos

mixed stripos ( string $haystack, string $needle [, int $offset = 0 ] )

未分轻重缓急写的strpos。实现方式跟下面的类,主要是应用同一卖拷贝然后将需要比的字符串转换成稍写字符后进行再次展开查找。

stristr

string stristr ( string $haystack, mixed $needle [, bool $before_needle = false ] )

无分轻重缓急写的strstr。

基本源码

// 拷贝一份haystack
     haystack_dup = estrndup(haystack, haystack_len);

    if (Z_TYPE_P(needle) == IS_STRING) {
        char *orig_needle;
        if (!Z_STRLEN_P(needle)) {
            php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty needle");
            efree(haystack_dup);
            RETURN_FALSE;
        }
        orig_needle = estrndup(Z_STRVAL_P(needle), Z_STRLEN_P(needle));
        // 调用php_stristr函数找出orig_needle的值。
        found = php_stristr(haystack_dup, orig_needle,    haystack_len, Z_STRLEN_P(needle));
        efree(orig_needle);
    } else {
        if (php_needle_char(needle, needle_char TSRMLS_CC) != SUCCESS) {
            efree(haystack_dup);
            RETURN_FALSE;
        }
        needle_char[1] = 0;

        found = php_stristr(haystack_dup, needle_char,    haystack_len, 1);
    }

    if (found) {
        found_offset = found - haystack_dup;
        if (part) {
            RETVAL_STRINGL(haystack, found_offset, 1);
        } else {
            RETVAL_STRINGL(haystack + found_offset, haystack_len - found_offset, 1);
        }
    } else {
        RETVAL_FALSE;
    }

    // 释放变量
    efree(haystack_dup);

得掌握,found是自从php_stristr被取得的,继续查看php_stristr函数:

PHPAPI char *php_stristr(char *s, char *t, size_t s_len, size_t t_len)
{
    php_strtolower(s, s_len);
    php_strtolower(t, t_len);
    return php_memnstr(s, t, t_len, s + s_len);
}

这个函数的效应就是是将字符串都改变成为多少写之后调用php_mennstr函数来寻找needle在haystack美学原理第一不良面世的职。

总结

盖strpos/stripos返回的凡岗位,位置从0开始计算,所以判断查找未果都因此  === FALSE 更符合。

翻阅PHP的源码收获甚多,一方面可理解某函数的切实可行落实原理是怎的,另一方面可以学习及一些编程优化方案。

 

至此本文结束,如果还有什么问题还是建议,可以多交流,原创文章,文笔有限,才疏学浅,文中若发生不正之处,万望告知。

假若本文对君生帮扶,望点下推荐,谢谢^_^

 

末再安利一下,我以github有针对PHP源码更详实的诠释。感兴趣的好扫描一下,给个star。PHP5.4源码注解。可以通过commit记录查看已长的注解。

更多源码文章,欢迎访问个人主页继续翻看:hoohack