Python笔记----关于robots.txt

优质文章学习记录

25 Dec 2024 — 1 min read

import urllib.robotparser import requests import time ''' 使用robots.txt ''' urls = ['http://www.baidu.com', 'http://www.jingdong.com'] # RobotFileParser():可以方便的判断哪些页面可以抓取，哪些页面不可以抓取 rp = urllib.robotparser.RobotFileParser() rp.set_url('https://www.baidu.com/robots.txt') rp.read() print(rp.can_fetch('Googlebot', 'https://www.baidu.com/baidu')) print(rp.can_fetch('Baiduspider', 'https://www.baidu.com/cpro')) def get_data(url, num_retries=3): try: data = requests.get(url, timeout=5) print(data.status_code) except requests.exceptions.ConnectionError as e: print('请求错误, url: ', url) print('错误详情: ', e) data = None except: print('未知错误! url:', url) data = None if (data != None) and (500 <= data.status_code <= 599): if num_retries > 0: print('服务器错误,正在重试...') time.sleep(1) num_retries -= 1 get_data(url, num_retries) return data def robots_check(robots_txt_url, headers, url): rp = urllib.robotparser.RobotFileParser() rp.set_url(robots_txt_url) rp.read() result = rp.can_fetch(headers['User-Agent'], url) return result for url in urls: if robots_check('https://www.baidu.com/robots.txt', {'User-Agent': 'Mozilla/5.0'}, url): data = get_data(url)

Read more

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

基于FPGA的北斗导航自适应抗干扰算法的设计与实现(任务书+开题报告+文献综述+代码+仿真+实物+毕业论文)

摘要如今，随着卫星导航技术的飞速发展，位置信息服务已经融入到我们的日常生活中，导航目前被称为继移动互联网后第三大产业。卫星导航在维护国家的安全中也发挥着不可替代的作用。为了使导航系统不受干扰的影响，本文以北斗导航系统为平台，研究基于阵列天线的自适应抗干扰算法。首先，文章就自适应抗干扰算法的原理和方法进行了系统介绍，并在MATLAB中建立阵列模型，对基于功率倒置算法的空域抗干扰算法和空时联合抗干扰算法进行性能仿真。然后根据系统的指标，确定了在FPGA中实现抗干扰算法的方案，包括数字下变频、权值计算、数据加权、数字上变频等模块。根据权值计算模块实现方式的不同，本文提供了两种抗干扰算法在FPGA中实现的方案：一种是基于FPGA嵌入式软核NIOS II的抗干扰实现，将权值计算的过程放在NIOS II软核中，用C语言进行实现；另一种是基于逻辑语言的抗干扰算法的实现，即用硬件描述语言Verilog HDL进行权值的计算。权值计算涉及到浮点数运算和Hermite矩阵求逆，本文给出了各模块的设计方法和仿真结果，并与MATLAB仿真结果进行对比。最后给出了两种实现方案的实测结果，表明两种实

FPGA 工程师到底有哪些方向？每个岗位都在干什么？一篇给你讲清楚

FPGA 工程师到底有哪些方向？每个岗位都在干什么？一篇给你讲清楚

很多人说“学 FPGA 就是写 Verilog”，但真正进了行业才发现—— FPGA 工程师并不是一个岗位，而是一整个岗位族群。不同公司、不同项目，对 FPGA 工程师的要求差异非常大。如果方向选错，可能学了半年发现岗位根本不对口。这篇文章就系统地给你拆一拆： 👉 FPGA 工程师到底有哪些岗位？ 👉 每个岗位具体干什么？ 👉 需要掌握哪些能力？ 👉 适合什么样的人？一、FPGA 工程师整体岗位划分（先给结论）从企业招聘角度来看，FPGA 岗位大致可以分为 6 类：岗位方向关键词偏向FPGA 逻辑设计工程师Verilog / 时序 / 接口核心开发FPGA 算法 / 加速工程师图像 / AI / DSP算法落地FPGA 底层驱动工程师DDR / PCIe / SerDes硬件接口FPGA 系统应用工程师Linux + FPGA系统集成FPGA 验证 / 测试仿真 / 验证质量保障FPGA 技术支持 / FA客户 / 项目支持应用型

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw-多飞书机器人与多Agent团队实战复盘

OpenClaw 多飞书机器人与多 Agent 团队实战复盘这篇文章完整记录一次从单机安装到多机器人协作落地的真实过程：包括 Windows 安装报错、Gateway 连通、模型切换、Feishu 配对、多 Agent 路由、身份错位修复，以及最终形成“产品-开发-测试-评审-文档-运维”团队。一、目标与结果这次实践的目标很明确： 1. 在 Windows 上稳定跑通 OpenClaw 2. 接入飞书机器人 3. 做到一个机器人对应一个 Agent 角色 4. 支持多模型并行（OpenAI + Ollama） 5. 最终形成可执行的多 Agent 团队最终落地状态（已验证）： * 渠道：Feishu 多账号在线 * 路由：按 accountId

宇树 G1 机器人开发入门：有线 & 无线连接完整指南

宇树 G1 机器人开发入门：有线 & 无线连接完整指南

适用读者：机器人二次开发者、科研人员开发环境：Ubuntu 20.04（推荐）机器人型号：Unitree G1 EDU+ 前言宇树 G1 是一款面向科研与商业应用的高性能人形机器人，支持丰富的二次开发接口。在正式进行算法调试与功能开发之前，首要任务是建立稳定的开发连接。本文将详细介绍两种主流连接方式：有线（网线直连）与无线（WiFi + SSH），并附上完整的配置流程，帮助开发者快速上手。一、有线连接（推荐新手优先使用）有线连接通过网线直接将开发电脑与 G1 机器人相连，具有延迟低、稳定性高、不依赖外部网络的优势，是新手入门和底层调试的首选方式。 1.1 前置条件所需物品说明开发电脑推荐安装 Ubuntu 20.04，或在 Windows 上使用虚拟机宇树 G1 机器人确保已开机且处于正常状态网线（