输入 &#googlecom&# 后会发生什么?

输入

您是否想过在浏览器中输入“google.com”到看到熟悉的搜索页面出现之间的几分之一秒内发生的一系列复杂事件?在这个详细的探索中,我们将揭开网络技术、网络协议以及使我们的在线体验成为可能的错综复杂的数据的迷人世界。

1. 旅程开始:您的浏览器和操作系统

1.1 浏览器的第一步

当您输入“google.com”并按 enter 键时,您的浏览器就会启动:

  1. url 解析:浏览器首先分析您输入的 url。它标识协议(在本例中,隐含“http://”或“https://”)、域名(“google.com”)以及任何其他路径或查询参数(在这个简单示例中没有) .

  2. hsts 检查:对于 google 等具有安全意识的网站,浏览器会检查其 http 严格传输安全 (hsts) 列表。如果 google.com 在此列表中(确实如此),浏览器会自动将请求升级到 https

  3. 缓存检查:在连接到网络之前,浏览器会检查其本地缓存。该缓存存储以前访问的信息,包括:

    • dns 缓存:与 google.com 关联的 ip 地址
    • 资源缓存:html、css、javascript 文件以及来自 google 主页的图像

如果找到其中任何一个并且仍然有效(未过期),浏览器可以跳过以下一些步骤。

1.2 操作系统的作用

如果浏览器在缓存中找不到必要的信息,则会向操作系统 (os) 寻求帮助:

  1. hosts 文件检查:操作系统首先查找本地“hosts”文件。该文件可以将域名映射到 ip 地址,从而可能绕过 dns 查找。但是,对于大多数用户来说,google.com 不会在此文件中。

  2. dns 客户端缓存:操作系统维护自己的 dns 缓存,与浏览器的缓存分开。接下来检查这里。

  3. 解析器配置:如果 ip 不在本地缓存中,操作系统准备询问 dns 服务器。它读取其网络配置以找出要查询的 dns 服务器(通常由您的互联网服务提供商提供或手动设置)。

2. dns解析:查找google的地址

如果 google.com 的 ip 地址未缓存,我们需要要求域名系统 (dns) 将人类可读的“google.com”转换为机器可用的 ip 地址。

2.1 dns 层次结构

dns 以层次结构组织:

  1. 根服务器:位于层次结构的顶部。他们知道在哪里可以找到 .com、.org、.net 等顶级域名 (tld) 的权威服务器。

  2. tld 服务器:这些服务器了解在其 tld 下注册的所有域。 .com tld 服务器了解 google.com。

  3. 权威名称服务器:这些服务器负责了解有关特定域的所有信息,包括其 ip 地址。

2.2 dns查询过程

  1. 递归解析器:您的 isp 的 dns 服务器(或其他配置的解析器)接收 google.com 的查询。如果没有缓存答案,它将启动递归过程:
  • 它向根服务器询问 .com
  • 根服务器将其引用到 .com tld 服务器
  • 它向 .com tld 服务器询问 google.com
  • .com 服务器将其引用至 google 的权威名称服务器
  • 它向 google 的名称服务器询问 google.com 的 ip
  • google 的名称服务器使用 ip 地址进行响应
  1. 缓存:此过程中的每个步骤都可能涉及缓存,因此并不总是需要完整的旅程。解析器通常会在 google 指定的时间内缓存最终结果(生存时间或 ttl)。

  2. 负载平衡:像 google 这样的大型服务通常会返回多个 ip 地址。这可以实现负载平衡并提高可靠性。

2.3 dns 查找示例

假设 dns 查找返回以下(简化的)结果:

google.com.     300    in    a     172.217.167.78

这意味着:

  • 域名是 google.com
  • 该记录的 ttl 为 300 秒(5 分钟)
  • 这是互联网(in)记录
  • 这是地址 (a) 记录类型
  • ip地址是172.217.167.78

3. 建立连接:tcp/ip

现在我们有了 google 的 ip 地址,是时候建立连接了。

3.1 tcp/ip协议栈

  1. 应用层:您的浏览器在此运行,使用 http(s) 进行通信。

  2. 传输层:此处使用 tcp 来确保可靠、有序的数据传输。

  3. 互联网层:ip 用于在网络之间路由数据包。

  4. 链路层:处理数据的物理传输,无论是通过以太网、wi-fi、蜂窝网络等。

3.2 tcp握手

为了建立连接,需要进行三向握手:

  1. syn:您的计算机向 google 的服务器发送 syn(同步)数据包。
  2. syn-ack:google 的服务器使用 syn-ack 数据包进行响应。
  3. ack:您的计算机发回一个 ack​​(确认)数据包。

此过程为对话建立序列号,确保数据包可以正确排序,并且可以检测和重新传输任何丢失的数据包。

3.3 tls 握手

对于 https 连接(google 使用),会发生额外的 tls(传输层安全)握手:

  1. 客户端您好:您的浏览器发送支持的 ssl/tls 版本、密码套件和随机数。
  2. 服务器问候:服务器选择 ssl/tls 版本和密码套件,发送其证书和另一个随机数。
  3. 身份验证:您的浏览器使用受信任的证书颁发机构验证服务器的证书。
  4. 密钥交换:建立安全的对称密钥来加密会话。

4. http请求:请求页面

建立安全连接后,您的浏览器将向 google 主页发送 http get 请求。

4.1 http 请求示例

get / http/2
host: www.google.com
user-agent: mozilla/5.0 (windows nt 10.0; win64; x64; rv:89.0) gecko/20100101 firefox/89.0
accept: text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8
accept-language: en-us,en;q=0.5
accept-encoding: gzip, deflate, br
connection: keep-alive
upgrade-insecure-requests: 1

此请求包括:

  • 我们请求的方法(get)和路径(/)
  • http 版本 (http/2)*
  • 各种标头提供有关浏览器及其功能的信息 *注意:http/2 仅指 https,而不是 http 连接。此请求是通过已建立的 https 连接发送的,即使标头未明确提及 https

5. 服务器处理:google 回应

google 的服务器接收此请求并进行处理。这可能涉及:

  1. 负载均衡:在许多服务器之间分发请求。
  2. 应用程序服务器:运行代码以生成响应。
  3. 数据库查询:获取个性化数据或搜索建议。
  4. 缓存:尽可能检索预先生成的内容。

6. http响应:发送页面

google 的服务器发回 http 响应,可能如下所示:

HTTP/2 200 OK
Content-Type: text/html; charset=UTF-8
Date: Sat, 21 Sep 2024 12:00:00 GMT
Expires: Sat, 21 Sep 2024 12:00:00 GMT
Cache-Control: private, max-age=0
Server: gws
X-XSS-Protection: 0
X-Frame-Options: SAMEORIGIN
[... other headers ...]



  
    <meta charset="utf-8"><title>Google</title>
    [... rest of the HTML ...]
  
  
    [... body content ...]
  

此回复包括:

  • 状态代码(200 ok)
  • 提供有关响应的元数据的各种标头
  • 页面的 html 内容

7. 渲染:让页面栩栩如生

您的浏览器现在具有 html 内容并开始渲染页面:

  1. 解析 html:浏览器解析 html,创建文档对象模型 (dom)。

  2. 请求额外资源:当它遇到 css、javascript、图像等链接时,它会发送对这些资源的额外 http 请求。

  3. 解析 css:浏览器解析 css 并将样式应用于 dom 元素,创建 css 对象模型 (cssom)。

  4. 执行javascript:浏览器执行javascript,可以修改dom和cssom。

  5. 渲染:浏览器使用最终的 dom cssom 在屏幕上渲染页面。

结论

看似简单的操作(输入“google.com”并按 enter)实际上涉及一系列复杂的步骤,从 dns 查找和网络协议到服务器端处理和客户端渲染。这种复杂的舞蹈在短短几毫秒内发生,展示了为我们的在线体验提供动力的令人难以置信的工程。

了解这些流程不仅可以满足我们的好奇心,还可以帮助 web 开发人员和 it 专业人员优化网站、解决问题并构建更高效、更安全的 web 应用程序。下次您导航到某个网站时,请花点时间欣赏幕后的技术奇迹,将网络带到您的屏幕上!


本博客中的图像是人工智能生成的。

另请阅读http 与 https 它们之间的区别

以上就是输入 &#googlecom&# 后会发生什么?的详细内容,更多请关注其它相关文章!