python 入门爬虫 -基础知识(数据如何呈现【一】)
2018-02-22 14:29
881 查看
网页信息的两种呈现方式:
1、HTML
2、JSON
HTML 是用来描述网页的一种语言
JSON是一种轻量级的数据交换方式
HTML 不是一种编程语言,而是一种标记语言 (markup language)
标记语言是一套标记标签 (markup tag)
HTML 使用标记标签来描述网页
HTML 标签通常是成对出现的,比如 <b> 和 </b>
标签对中的第一个标签是开始标签,第二个标签是结束标签
开始和结束标签也被称为开放标签和闭合标签
HTML 文档包含 HTML 标签和纯文本
HTML 文档也被称为网页
Web 浏览器的作用是读取 HTML 文档,并以网页的形式显示出它们。浏览器不会显示 HTML 标签,而是使用标签来解释页面的内容:<html>
<body>
<h1>我的第一个标题</h1>
<p>我的第一个段落。</p>
</body>
</html>
<body> 与 </body> 之间的文本是可见的页面内容
<h1> 与 </h1> 之间的文本被显示为标题
<p> 与 </p> 之间的文本被显示为段落
JSON 具有"自我描述性"(人类可读)
JSON 具有层级结构(值中存在值)
JSON 可通过 JavaScript 进行解析
JSON 数据可使用 AJAX 进行传输
更短
读写的速度更快
能够使用内建的 JavaScript eval() 方法进行解析
使用数组
不使用保留字
使用 XML DOM 来循环遍历文档
读取值并存储在变量中
用 eval() 处理 JSON 字符串
1、HTML
2、JSON
HTML 是用来描述网页的一种语言
JSON是一种轻量级的数据交换方式
HTML 简介
什么是 HTML?
HTML 是用来描述网页的一种语言。HTML 指的是超文本标记语言 (Hyper Text Markup Language)HTML 不是一种编程语言,而是一种标记语言 (markup language)
标记语言是一套标记标签 (markup tag)
HTML 使用标记标签来描述网页
HTML 标签
HTML 标记标签通常被称为 HTML 标签 (HTML tag)。HTML 标签是由尖括号包围的关键词,比如 <html>HTML 标签通常是成对出现的,比如 <b> 和 </b>
标签对中的第一个标签是开始标签,第二个标签是结束标签
开始和结束标签也被称为开放标签和闭合标签
HTML 文档 = 网页
HTML 文档描述网页HTML 文档包含 HTML 标签和纯文本
HTML 文档也被称为网页
Web 浏览器的作用是读取 HTML 文档,并以网页的形式显示出它们。浏览器不会显示 HTML 标签,而是使用标签来解释页面的内容:<html>
<body>
<h1>我的第一个标题</h1>
<p>我的第一个段落。</p>
</body>
</html>
例子解释
<html> 与 </html> 之间的文本描述网页<body> 与 </body> 之间的文本是可见的页面内容
<h1> 与 </h1> 之间的文本被显示为标题
<p> 与 </p> 之间的文本被显示为段落
JSON 简介
与 XML 相同之处
JSON 是纯文本JSON 具有"自我描述性"(人类可读)
JSON 具有层级结构(值中存在值)
JSON 可通过 JavaScript 进行解析
JSON 数据可使用 AJAX 进行传输
与 XML 不同之处
没有结束标签更短
读写的速度更快
能够使用内建的 JavaScript eval() 方法进行解析
使用数组
不使用保留字
为什么使用 JSON?
对于 AJAX 应用程序来说,JSON 比 XML 更快更易使用:使用 XML
读取 XML 文档使用 XML DOM 来循环遍历文档
读取值并存储在变量中
使用 JSON
读取 JSON 字符串用 eval() 处理 JSON 字符串
相关文章推荐
- python 入门爬虫 -基础知识(数据怎么来的【二】)
- python爬虫入门(1) 基础知识 ; 正则表达式 Re 模块
- 【python数据挖掘课程】二十二.Basemap地图包安装入门及基础知识讲解
- Python基础知识——爬虫入门
- 1 python大数据挖掘系列之基础知识入门
- [置顶] python爬虫实践——零基础快速入门(五)将爬取的数据存到本地
- Python基础学习-爬虫入门知识
- Python零基础入门十九之爬虫基础知识
- python 爬虫入门(2) 爬虫基础知识 ; urllib 模块 ;urllib2 模块
- Python学习入门笔记-基础知识
- swift入门基础知识1基本数据类型
- python python 入门学习之网页数据爬虫cnbeta文章保存
- Python 爬虫如何入门学习?
- Python 爬虫如何入门学习?
- Python爬虫入门二之爬虫基础了解
- python基础知识——内置数据结构(集合)
- Python入门基础知识(1) :locals() 和globals()
- Python爬虫入门基础
- Python学习手册(1入门知识-数据类型)
- Python学习入门基础教程(learning Python)--6 Python下的list数据类型