您好,欢迎访问一九零五行业门户网

PHP获取URL的方法【总结】

服务器变量: $_server 使用范例 php 代码 1. $uri = $_server [ 'request_uri' ]; 2. echo $uri ; 3. 输出: /snowing/products 4. 5. 6. $url = 'http://' . $_server [ 'server_name' ]. ':' . $_server [ server_port ]. $_server [ request_uri ]; 7. e
服务器变量:$_server 
使用范例 
php代码
1.  $uri = $_server['request_uri'];  
2.  echo  $uri;  
3.  输出:/snowing/products  
4.    
5.    
6.  $url = 'http://'.$_server['server_name'].':'.$_server[server_port].$_server[request_uri];  
7.  echo  $url;  
8.  输出:http://www.site.com:80/snowing/products  
9.    
10.  
11.$http = (isset($_server['https'])&&$_server['https']!='off')?'https://':'http://';  
12.$port = $_server[server_port]==80?'':':'$_server[server_port];  
13.$url = $http.$port.$_server[request_uri];  
14.echo  $url;  
15.输出:http://www.site.com/snowing/products
注: 在 php 4.1.0 及以后版本使用。之前的版本,使用 $http_server_vars。
$_server 是一个包含诸如头部(headers)、路径(paths)和脚本位置(script locations)的数组。数组的实体由 web 服务器创建。不能保证所有的服务器都能产生所有的信息;服务器可能忽略了一些信息,或者产生了一些未在下面列出的新的信息。这意味着,大量的这些变量在 cgi 1.1 specification 中说明,所以您应该仔细研究它。
这是一个“superglobal”,或者可以描述为自动全局变量。这只不过意味这它在所有的脚本中都有效。在函数或方法中您不需要使用 global $_server; 访问它,就如同使用 $http_server_vars 一样。
$http_server_vars 包含着同样的信息,但它不是一个自动全局变量。(注意:$http_server_vars 和 $_server 是不同的变量,php 处理它们的方式不同。)
如果设置了 register_globals 指令,这些变量也在所有脚本中可用;也就是,分离了 $_server 和$http_server_vars 数组。相关信息,请参阅安全的相关章节 使用 register globals。这些单独的全局变量不是自动全局变量。
您或许会发现下面列出的某些 $_server 元素并不可用。注意,如果以命令行方式运行 php,下面列出的元素几乎没有有效的(或是没有任何实际意义的)。
“php_self” 
当前正在执行脚本的文件名,与 document root相关。举例来说,在url地址为http://example.com/test.php/foo.bar 的脚本中使用 $_server['php_self'] 将会得到 /test.php/foo.bar这个结果。 如果 php 以命令行方式运行,该变量无效。
“argv” 
传递给该脚本的参数。当脚本运行在命令行方式时,argv 变量传递给程序 c 语言样式的命令行参数。当调用 get 方法时,该变量包含请求的数据。
“argc” 
包含传递给程序的命令行参数的个数(如果运行在命令行模式)。
“gateway_interface” 
服务器使用的 cgi 规范的版本。例如,“cgi/1.1”。
'server_name' 
当前运行脚本所在服务器主机的名称。如果该脚本运行在一个虚拟主机上,该名称是由那个虚拟主机所设置的值决定。
'server_software' 
服务器标识的字串,在响应请求时的头部中给出。
“server_protocol” 
请求页面时通信协议的名称和版本。例如,“http/1.0”。
“request_method” 
访问页面时的请求方法。例如:“get”、“head”,“post”,“put”。
“query_string” 
查询(query)的字符串。
“document_root” 
当前运行脚本所在的文档根目录。在服务器配置文件中定义。
“http_accept” 
当前请求的 accept: 头部的内容。
“http_accept_charset” 
当前请求的 accept-charset: 头部的内容。例如:“iso-8859-1,*,utf-8”。
“http_accept_encoding” 
当前请求的 accept-encoding: 头部的内容。例如:“gzip”。
“http_accept_language” 
当前请求的 accept-language: 头部的内容。例如:“en”。
“http_connection” 
当前请求的 connection: 头部的内容。例如:“keep-alive”。
“http_host” 
当前请求的 host: 头部的内容。
“http_referer” 
链接到当前页面的前一页面的 url 地址。不是所有的用户代理(浏览器)都会设置这个变量,而且有的还可以手工修改 http_referer。因此,这个变量不总是正确真实的。
“http_user_agent” 
当前请求的 user_agent: 头部的内容。该字符串表明了访问该页面的用户代理的信息。一个典型的例子是:mozilla/4.5 [en] (x11; u; linux 2.2.9 i586)。您也可以使用 get_browser() 得到这个信息。
“remote_addr” 
正在浏览当前页面用户的 ip 地址。
'remote_host' 
正在浏览当前页面用户的主机名。反向域名解析基于该用户的 remote_addr。
注: 必须配置 web 服务器来建立此变量。例如 apache 需要在 httpd.conf 中有 hostnamelookups on。参见 gethostbyaddr()。
“remote_port” 
用户连接到服务器时所使用的端口。
“script_filename” 
当前执行脚本的绝对路径名。
“server_admin” 
该值指明了 apache 服务器配置文件中的 server_admin 参数。如果脚本运行在一个虚拟主机上,则该值是那个虚拟主机的值。
“server_port” 
服务器所使用的端口。默认为“80”。如果你使用 ssl 安全连接,则这个值为您所设置的 http 端口。
“server_signature” 
包含服务器版本和虚拟主机名的字符串。
“path_translated” 
当前脚本所在文件系统(不是文档根目录)的基本路径。这是在服务器进行虚拟到真实路径的映像后的结果。
“script_name” 
包含当前脚本的路径。这在页面需要指向自己时非常有用。
“request_uri” 
访问此页面所需的 uri。例如,“/index.html”。
“php_auth_user” 
当 php 运行在 apache 模块方式下,并且正在使用 http 认证功能,这个变量便是用户输入的用户名。
“php_auth_pw” 
当 php 运行在 apache 模块方式下,并且正在使用 http 认证功能,这个变量便是用户输入的密码。
“auth_type” 
当 php 运行在 apache 模块方式下,并且正在使用 http 认证功能,这个变量便是认证的类型。
?  获取访客来路url地址信息
    不少网站访问统计程序提供有“来路”信息,客户查阅统计资料时从中得知访问者从什么网站连接过来。所谓“来路”,其实就是别人从哪里点击了你网站的链接,即,从什么页面连接到你的网站。在php中,获取“来路”信息是非常简单的,我们只需用到referer。http头携带的信息当中包含有一个变量$_server['http_referer'],它提供的就是“来路”完整url地址。以下代码放入你的php页面脚本,它就能够打印出连接到该脚本所在页面的具体地址(即“来路”):
$v_url=$http_referer;
print $v_url;
比如,用户从本站的友情链接点击你的网站,你将得到类似”htttp://www.ilife8.com/code/773.html“的url地址。就这么简单。
来路的url地址可能是很长的。作为来路地址,很多情况下,我们可能只关心它属于哪个网站,即,网站的虚拟主机名叫什么。一个url地址包含有诸多实体信息,主要有:
·方案(scheme)- http
·主机(host) – www.ilife8.com
·路径(path) – /code/773.html
php提供一个截取这些实体信息的简便方案:parse_url()函数。
?  parse_url()函数
    array  parse_url ( string  url );
parse_url()函数解析一个url并返回一个关联数组,包含在url 中出现的各种组成部分。本函数不是用来验证给定url 的合法性的,只是将其分解为下面列出的部分。不完整的 url 也被接受,parse_url() 会尝试尽量正确地将其解析。对严重不合格的 url,parse_url() 可能会返回 false 并发出 e_warning。否则会返回一个关联数组,其组成部分为(至少有一个):
scheme - 如 httphostportuserpasspathquery - 在问号 ? 之后fragment - 在散列符号 # 之后example #1 parse_url() 例子
以上例程会输出:
array
(
[scheme] => http
[host] => hostname
[user] => username
[pass] => password
[path] => /path
[query] => arg=value
[fragment] => anchor
)
可以看到,可以很容易分解出一个url的各个部,那如果要拿指定的部分出来的话也很容易,如:
echo parse_url($url,php_url_path);
就是在第二个参数中,设定如下的参数:php_url_scheme, php_url_host, php_url_port, php_url_user, php_url_pass, php_url_path, php_url_query or php_url_fragment.
parse_url() 是专门用来解析 url 而不是 uri 的,也不能用于相对 url。不过为遵从 php 向后兼容的需要有个例外,对file:// 协议允许三个斜线(file:///...)。其它任何协议都不能这样。
?  pathinfo()函数
mixed pathinfo ( string $path [, int $options ] )
pathinfo() 返回一个关联数组包含有 path 的信息。包括以下的数组单元:dirname,basename 和extension。
可以通过参数 options 指定要返回哪些单元。它们包括:pathinfo_dirname,pathinfo_basename 和pathinfo_extension。默认是返回全部的单元。如果不是要求取得所有单元,则本函数返回字符串。
example #1 pathinfo() 例子
以上例程会输出:
/www/htdocs
index.html
html
?  其他相关函数
dirname() - 返回路径中的目录部分
basename() - 返回路径中的文件名部分
其它类似信息

推荐信息