什么是url? 所有的东西都有一个标准化的东西,公交有线路号,飞机有航班号,个人有身份证号,你坐出租车,告诉司机师傅我要到石牌华师,他就能明白你的意思了。url就是因特网资源的标准化名称。url指向一条电子信息片段,告诉你它们位于何处,以及如何与他们进行交互。
uri 统一资源标识符(uniform resource identifier,uri)是一类更通用的资源标识符,它包括url和urn。url是通过描述资源的位置来标识资源的,而urn是通过名字来识别资源的,与它们当前所处的位置无关。
url语法 我们普通时候遇到的大部分的url(比如”http://soccer.hupu.com/germany“)是由三部分组成的:方案(http)、主机(soccer.hupu.com)、路径(/germany)。url的语法随方案的不同而有所不同!大多数url方案的url语法都建立在由9部分构成的通用格式上:
://:@:/;?#
不过几乎没有哪个url包含所有这些组件。
方案 首先我们来看看什么叫方案。
方案实际上是规定如何访问指定资源的主要标识符,它会告诉负责解析url的应用程序应该使用什么协议。我们最常用的http(目前大部分浏览器都会帮你省略掉这个部分)、https(http的安全版)、ftp等等。
方案名是不区分大小写的,也就是说”http://www.google.com“和”http:www.google.com“是等价的(你可以去你的浏览器里去试一下)。
主机与端口 我们要访问因特网上的资源,要知道是哪台机器装载了该资源,以及在该机器的什么位置可以找到该资源,这就是url内主机与端口提供的信息。我们可以用主机名(www.hupu.com)或者ip地址(112.90.32.241)来表示主机名。端口组件标识了服务器正在监听的端口,http的默认端口为80,https的默认端口为443。
用户名和密码 用户和密码组件通常出现在ftp协议中。
ftp://ftp.prep.ai.mit.edu/pub/gnu这个例子中没有用户和密码组件。当url方案要求输入用户名和密码时,它会插入anonymous作为你的用户名,并发送一个默认密码。
ftp://anonymous@ftp.prep.ai.mit..edu/pug/gnu该例子中显示了一个指定的用户名anonymous。字符@讲用户和密码组件与url的其他部分分隔开来。
ftp://anonymous:my_password@ftp.prep.ai.mit.edu/pub/gnu指定了用户名和密码,由”:”分。
路径 就像pc中文件路径一样。每个路径都有自己的参数。
参数 url中的参数组件是名值对列表,由字符”;”将其与url的其他部分分隔开来。它们为应用程序提供了访问资源所需要的附加信息。ftp://ftp.prep.ai.mit.edu/pub/gnu;type=d
能看出上述例子中的参数名是什么,参数的值是什么吗?
查询 我们用一个例子来说明http://bbs:scoccer.com/15630262.html?item=123。这个例子中?右边的内容就是查询组件。我们通过查询组件来缩小所请求资源的范围。
我们一般用“名/值”的方式来查询,名值对之间用&分隔:http://bbs:scoccer.com/15630262.html?item=123&color=blue。
片段 url支持用片段组件来表示一个资源内部的片段,如html文档中一个特定的图片和小节。比如:
http://bbs:scoccer.com/15630262.html#robben
*http服务器处理整个对象,而不是对象的片段,从服务器返回的是整个资源后,由客户端的浏览器来显示你感兴趣的片段。 url快捷方式 url有两种方式:绝对的和相对的。我们一般见到的都是绝对url。而相对url是url的一种便捷缩略记法,是url的片段或者一小部分。有过开发经验的应该也都见过。我们来看一下一个html文档
joe's toolstools pagehammersjoe's hardware online has the largest selection of hammers on the earth.
drillsjoe's hardware has a complete line of cordless and corded drills,as well as the latest in plutonium-powered atomic drills, for thosebig around the house jobs.
...
其中 ./hammers.html就是一个相对路径。
既然说是相对路径,那它肯定有个相对的对象。这个对象就是所谓的基础url。这个例子中,基础url是http://www.joes-hardware.com/tools.com。那么基础url是怎么来的呢。
1、在资源中显示提供。比如html文档中可能会包含一个定义了基础url的标记
2、封装资源的基础url。如果没有显式指定基础url,可以将它所属资源的url作为基础。
3、没有基础url。通常意味这是一个绝对url,当然也有可能这个url是不完整的。
那么我们如何将一个相对的url转换为绝对的url呢?我们看下面这个图。
我们对./hanmmers.html使用图中的算法。
1)路径为./hammmers.html,基础url为http://www.joes-hardware.com/tools.html
2)方案为空,继承基础url的方案(http)
3)组件为空,继承主机和端口组件
4)将相对url和继承的组件合并:http://www.joes-hardware.com/hammmers.html。
自动扩展url 主机名扩展 《http权威指南》中说我们在地址栏中输入yahoo,就会自动在主机名中插入www.和.com,不过目前我还没有找到对应的例子
历史扩展 这个我们日常中用的很多了,通过我们访问过的网站,浏览器会自动帮我们提供一些完整的选项供我们选择。
未来 我们已经知道url提供的是我们所需资源所处的位置,它的缺点是,一旦该资源被移走,我们就不能通过url对该资源进行定位了。我们解决方案正式前面提到的urn。
urn(uniform resource name)统一资源名。其思想是在资源搜索的过程中引入另外一个中间层,通过一个中间资源定位符,服务器对资源的实际url进行登记和跟踪,这样不管我们的资源被移动到了何处,只要它没有被删除,定位符就可以以这个资源重定向到所请求资源的实际url中去。不过想要取代url还需要一定的时间,这也不是web开发中的紧迫问题。