“客户端密钥”实际上是您的 Google Cloud 的密码(请勿将其公开或在线分享)
第四部分:将 OAuth 2.0 凭据添加到 Config.py 文件
1. 返回 Google Drive 并导航到“api”文件夹。
2.点击进入config.py。
点击进入config.py
3.选择用“文本编辑器”(或您选择的 香港电报号码 其他应用程序)打开来修改config.py文件。
选择用文本编辑器打开修改config.py文件
4. 更新下面突出显示的三个区域:
CLIENT_ID:来自 OAuth 2.0 客户端 ID 设置过程
CLIENT_SECRET:来自 OAuth 2.0 客户端 ID 设置过程
GOOGLE_CREDENTIALS:与您的 CLIENT_ID 和 CLIENT_SECRET 对应的电子邮件
更新 CLIENT_ID(来自 OAuth 2.0 客户端 ID 设置流程)、CLIENT_SECRET(来自 OAuth 2.0 客户端 ID 设置流程)以及与您的 CLIENT_ID 和 CLIENT_SECRET 相对应的 GOOGLE_CREDENTIALS 电子邮件
5. 更新后保存文件!
恭喜,无聊的部分已经结束了。现在您可以开始使用 Google Colab 文件了!
运行您的第一个分析
运行你的第一次分析可能会有点令人生畏,但坚持下去它很快就会变得容易。
下面,我们提供了有关所需输入变量的详细信息,以及运行脚本和分析结果数据集时需要注意的事项。
在我们介绍完这些项目之后,还会提供一些示例项目和视频演示,展示如何利用这些数据集向客户交付成果。
设置输入变量
使用“xpath_selector”变量进行 XPath 提取
您是否曾经想知道每个导致网页点击和展示的查询,这些查询并不包含在您的 <title> 或 <h1> 标签中?这个参数可以让您做到这一点。
虽然这是可选的,但我们强烈建议您使用此功能,并且我们认为它可以“增强”分析能力。只需使用 Xpath 定义站点部分,脚本就会完成剩下的工作。
在上面的视频中,您将看到有关如何创建特定于站点的提取的示例。此外,下面是一些通用提取,它们应该适用于网络上的几乎所有站点:
'//title' # 标识 <title> 标签
'//h1' # 标识 <h1> 标签
'//h2' # 标识 <h2> 标签
站点特定:如何仅抓取主要内容(MC)?
链接 Xpath – 在 Xpath 之间添加“|”
'//title | //h1' # 一次运行即可获得 <title> 和 <h1> 标签
'//h1 | //h2 | //h3' # 一次运行即可获得 <h1>、<h2> 和 <h3> 标签
其他变量
以下是其他变量的视频概述以及每个变量的简短描述。
'colab_path' [必需] – Colab 文件所在的路径。这应该是“/content/drive/My Drive/Colab Notebooks/”。
'domain_lookup' [必需] – 用于分析的网站主页。
“startdate” 和 “enddate” [必需] –分析期的日期范围。
'gsc_sorting_field' [必需] – 该工具会提取用户定义的前 N 个页面。“前”由“clicks_sum”或“impressions_sum”定义。请观看视频以了解更详细的说明。
'gsc_limit_pages_number' [必需] – 表示您希望在数据集内得到的结果页面数量的数字值。
'brand_exclusions' [可选] -通常导致品牌查询的字符串序列(例如,包含“inseev”的任何内容都将成为“Inseev Interactive”的品牌查询)。
'impressions_exclusion' [可选] –用于排除由于缺乏预先存在的展示而可能不相关的查询的数值。这主要适用于在大量页面上具有强大预先存在排名的域。
'page_inclusions' [可选] – 在所需分析页面类型中找到的字符串序列。如果您想分析整个域,请将此部分留空。