众所周知,Chrome是建立在开源的Chromium项目上的。

而且不得不说,学习并分析开源项目的代码对一个程序员的提高确实蛮大的。这篇博文我会记录一下学习过程中我遇到的一些问题,并分享学习中我所参考的几篇优秀的Chromium代码分析文章。

构建的一点吐槽和官方的方法文档摘录

 
不看不知道,编译好的Chromium可执行文件虽然只有40+M,但打包好的源码文件包竟然高达3G之多(也许是我孤陋寡闻了,但是这个反差确实让我吓我一跳)。
Chromium的构建方法就不多说了,推荐官方的安装方法文档
值得一提的是,一定要按照所提供的办法严格的执行,不然可能会遇到各种编译错误。编译过程很可能会长达数小时之久 (在我的笔记本上构建了一整晚才完成 ... )。为了加速编译过程,上面的文档推荐使用多核CPU,64位windows,至少8G内存和60G硬盘空间。还有其他的几点:
  • 尽量使用Visual Studio 2010 SP1 版本,不然precompiled headers模式可能会出现很多问题。由于Chromium中有大量的头文件,使用此选项大概能加速25%。
  • 关闭杀毒软件,或者把.ilk, .pdb, .cc, .h文件加入白名单。再或者,把Chromium源代码目录加入杀毒软件白名单。
  • 在一个没有虚拟内存交换的硬盘上构建Chromium。或者固态硬盘,如果可能的话。
  • 使用ninja构建Chromium。这是Google专门为Chromium项目开发的构建工具链,笔者没有尝试,文档称使用ninja会让incremental linking过程快很多。
  • 修改Visual Studio选项,减少同时链接的项目数量,以减少Chromium链接时所需要的内存。因为Chromium链接需要大量的内存,如果内存不足,大量的分页操作会大大降低系统的反应速度。"maximum number of parallel project builds"可以在Tools/Options/Projects and Solutions/Build and Run页面找到。这个选项可以减少Visual Studio启动的VCBuildHelper.exe实例数目。
  • 修改include.gypi文件,减少同时执行的cl.exe的数目。默认情况下,Visual Studio会开启/MP选项,动用系统一切资源生成多个编译进程加速编译。但是由于Chromium项目过大,最差情况下一个cl.exe(链接器)可能会占用大约1G内存。
 
Visual Studio中调试Chromium浅谈
 

分析Chromium源码,为了快速的在代码海洋中找到自己所需要的部分,不可避免的要调试的Chromium项目。比如说,我们想知道,Chromium是如何从页面上下载一张图片,经过渲染,最后显示在页面上的呢?这个流程实际上的要比看起来复杂不少:一个页面内的WebKit分析出DOM树,发现一个<img>元素里的图片需要显示;WebKit发送一个URL下载的IPC消息给主进程Browser Process,然后WebKit根据返回数据的MIME类型标签进行解析,发现这个资源是个图片,再根据编码方式调用相应的WebCore::ImageDecoder类进行解码,最后还要进行一系列的渲染,把需要绘制的东西交给RenderWidget,这样我们才能看到图片。这个过程如果单纯的去浏览代码找到对应的类和方法调用关系,效率低下不说,还很容易出错,这时候我们就需要在Chromium中进行代码调试和追踪了。

 
有个关键问题,Chromium不同于普通的单进程程序,默认情况下它是多进程模式的。比如,新打开的只有一个首页的Chrome程序,至少有3个相关进程,分别是Browser进程(管理所有的UI框架,全局消息传递,资源下载等等),GPU进程(提供WebGL渲染,绕过沙盒机制调用3D API),和渲染进程Renderer(包括首页响应用户操作的content和负责渲染的WebKit实例等等),甚至还可能还有其他的进程外运行的插件进程,等等。具体的Chrome进程模型还有不同进程之间如何用IPC消息进行交互的,请参考本文推荐的阅读源。如果直接通过visual studio进行调试,只有主进程(Browser)被调试,而负责渲染的renderer进程则像是其他程序一样。最直观的表现就是,使用Chrome浏览器时,Windows任务管理器中会出现多个chrome.exe进程实例。
 
调试多进程的Chromium,其实利用visual studio自带的工具就完全可以进行: 调试开始后,只要把已经运行起来的子进程附加到debugger上就可以了。具体操作是,开始调试,选择Tools > Attach to Process, 然后按住ctrl选择多个你想要调试的chrome.exe进程,附加到debugger上。另外,最好用debug构建的Chromium进行调试,不然release的编译器优化问题会产生一些很诡异的情况(比如取不到特定变量的值,跳过了一些被优化过的函数什么的。。。)
附加进程到debugger的界面如图所示:
附加到debugger后,你可以在process窗口看到正在调试的进程:
 
另外,刚才说过,Chromium默认情况下是多进程模式(Process-per-site-instance,一个网站打开的所有页面属于同一进程)。你还可以提供运行时参数--single-process,强制让Chromium只用一个进程运行。这种模式可以通过传统的方式进行调试,但是这种模式属于实验性质的,可能会有这样和那样的bug出现,导致页面崩溃。
 
Chromium project官网还提供了多个调试办法,不过直接利用visual studio的附加到进程方式最简便。http://dev.chromium.org/developers/how-tos/debugging
 
不过实际开发调试中,开发者并不需要每次都要打开庞大的Chromium项目。Chromium源码目录还包含了2个供测试开发用的项目,分别是content_shell和test_shell,默认情况下这两个项目可以从src\content\content.sln和src\webkit\webkit.sln中打开。test_shell主要展示了chromium webkit API,包含了大部分的webkit渲染引擎核心的chrome移植接口(不包括HTML5,GPU加速,沙箱模型),注意,它是单进程的。对于content_shell,这个程序主要用来展示content shell API,它几乎包含了所有的浏览器的功能,像是一个没有外壳的浏览器。跟test_shell不同,content_shell是多进程的,进程模型与chromium相同。如果你愿意,完全可以在content_shell上加一个外壳变成自己自主开发的浏览器。开发者可以根据自己的需要(比如,单独测试Webkit部分,或是要研究不同浏览器部件之间如何进行交互)选择不同的程序调试或开发。
 
下图是一个content_shell在windows下运行的效果。注意,这个东西处理HTTP请求很慢(content API并不包括完整的资源下载功能,Chrome的所有资源下载都是通过Browser进程负责的),最好只用来测试本地的页面。
 
推荐阅读和引用来源
 
从零开始分析源码来了解Chromium项目是十分困难的。好在Google为我们提供了不少有用的文章,具体可以从 The Chromium Project->For Developers->How-Tos 搜索。不过这些文章有些晦涩难懂,二来是英语的,阅读起来会对我等英语渣渣造成困难;这里推荐以下几个中文博客:
  • Chrome源码剖析 1~5 by duguguiyu。这位大神在08年Chromium刚公布源码后就进行了系统化并且通俗易懂的源码分析(说实话帮了我大忙~谢谢大神)。文章没有从代码上进行详细说明,而是从更高一层的设计层面分析了Chrome的不同组件,这是更难能可贵的。具体内容包括了Chromium的多线程任务模型、多进程浏览页模型,Chrome内的IPC消息传递机制,Chrome的图形渲染绘制流程。
  • Chrome源码阅读 by zero_lee。这位作者主要从代码层面分析了多个Chrome内部类的作用和实现技巧,对于代码的理解很有帮助。
  • Chromium研究 by chen.zhengyong。作者把眼光放在了Linux系统和嵌入式设备上的Chrome的开发和实现上。里面有很多绘制精美的UML图,值得一看。
  • Chrome扩展开发文档中文版 by 360。360公司翻译的Chrome扩展开发文档,如果要写Chrome扩展(不是插件,扩展和插件在Chrome中是两种东西)大概会有用。
 

chromiun 学习《一》的更多相关文章

  1. chromiun 学习《二》 目录结构 +启动流程

    1.chromium的目录结构. 2.先上分析图一张.主要是从BrowserMain进程进行分析的.

  2. 从直播编程到直播教育:LiveEdu.tv开启多元化的在线学习直播时代

    2015年9月,一个叫Livecoding.tv的网站在互联网上引起了编程界的注意.缘于Pingwest品玩的一位编辑在上网时无意中发现了这个网站,并写了一篇文章<一个比直播睡觉更奇怪的网站:直 ...

  3. Angular2学习笔记(1)

    Angular2学习笔记(1) 1. 写在前面 之前基于Electron写过一个Markdown编辑器.就其功能而言,主要功能已经实现,一些小的不影响使用的功能由于时间关系还没有完成:但就代码而言,之 ...

  4. ABP入门系列(1)——学习Abp框架之实操演练

    作为.Net工地搬砖长工一名,一直致力于挖坑(Bug)填坑(Debug),但技术却不见长进.也曾热情于新技术的学习,憧憬过成为技术大拿.从前端到后端,从bootstrap到javascript,从py ...

  5. 消息队列——RabbitMQ学习笔记

    消息队列--RabbitMQ学习笔记 1. 写在前面 昨天简单学习了一个消息队列项目--RabbitMQ,今天趁热打铁,将学到的东西记录下来. 学习的资料主要是官网给出的6个基本的消息发送/接收模型, ...

  6. js学习笔记:webpack基础入门(一)

    之前听说过webpack,今天想正式的接触一下,先跟着webpack的官方用户指南走: 在这里有: 如何安装webpack 如何使用webpack 如何使用loader 如何使用webpack的开发者 ...

  7. Unity3d学习 制作地形

    这周学习了如何在unity中制作地形,就是在一个Terrain的对象上盖几座小山,在山底种几棵树,那就讲一下如何完成上述内容. 1.在新键得项目的游戏的Hierarchy目录中新键一个Terrain对 ...

  8. 《Django By Example》第四章 中文 翻译 (个人学习,渣翻)

    书籍出处:https://www.packtpub.com/web-development/django-example 原作者:Antonio Melé (译者注:祝大家新年快乐,这次带来<D ...

  9. 菜鸟Python学习笔记第一天:关于一些函数库的使用

    2017年1月3日 星期二 大一学习一门新的计算机语言真的很难,有时候连函数拼写出错查错都能查半天,没办法,谁让我英语太渣. 关于计算机语言的学习我想还是从C语言学习开始为好,Python有很多语言的 ...

随机推荐

  1. Vmware中Ubuntu的各种问题

    Question1: Ubuntu正在运行的时候手残强行关闭了Vmware软件,重启软件发现如下图所示的状态: ''' 完全黑屏怎么解决,提示信息是recovering journal就是说正在恢复日 ...

  2. linux中C语言获取高精度时钟gettimeofday函数

    前言:    在开发中,很多时候需要知道各个函数或者是某些设备对命令的操作用时,因此需要用到 gettimeofday 来获取当前时钟. 一,函数说明 #include  int gettimeofd ...

  3. Vertica 项目常用代码

    1.查看目录下面有多少文件数 ls -l |grep "^-"|wc -l 思路很明显了,ls后通过grep进行过滤判断是文件还是文件夹, 如果是判断文件夹,可以使用ls -l | ...

  4. Excel demo in SSIS

    需求如下,把异常数据从sqlserver数据库中取出来,然后导入到xls中去,然后再发邮件给用户,把xls作为附件发送. 需要的示例数据表: /* create table abnormaldata( ...

  5. Linux 系统常用命令汇总(四) 程序和资源管理

    程序和资源管理 分类 命令 选项 注解 背景管理 & command+& 将任务放到后台进行 ctrl+z 暂停任务 fg [%number] 讲后台程序推到前台来,number表示进 ...

  6. selenium循环点击文本框

    1.可以用xpath循环点击checkbox List<WebElement> list = dr.findElements(By.className("datagrid-row ...

  7. codeforces 480A A. Exams(贪心)

    题目链接: A. Exams time limit per test 1 second memory limit per test 256 megabytes input standard input ...

  8. 【转】Python 列表排序

    很多时候,我们需要对List进行排序,Python提供了两个方法 对给定的List L进行排序, 方法1.用List的成员函数sort进行排序 方法2.用built-in函数sorted进行排序(从2 ...

  9. IL查看泛型

    查看泛型的IL 我们在开发中经常用到泛型,下面一起通过IL来查看泛型背后做了那些工作 示例代码 示例代码如下: using System;   namespace MyCollection { pub ...

  10. win10自动更新彻底关闭

    http://app.techweb.com.cn/wp/2016-10-24/2418646.shtml