极客日志 (Page 22)

Python + Selenium + AI 智能爬虫：自动识别反爬与数据提取

结合 Selenium 浏览器自动化与 AI 大模型能力，构建能够自动识别反爬机制、智能解析页面的新一代爬虫系统。 1. 系统架构验证码登录墙正常页面种子 URL 队列调度器 Selenium WebDriver 反检测模块页面渲染 AI 反爬识别 AI 验证码破解自动登录 AI 数据提取数据清洗管道存储 MongoDB / CSV 数据看板 2. 反爬机制分布 35%25%20%10%7%3%常见反爬机制占比（Top 500 网站统计）JS 动态渲染请求频率限制验证码（图形/滑块）User-Agent 检测IP

AI【应用 04】FunASR离线文件转写服务开发指南（实践篇）

FunASR离线文件转写服务开发指南（实践篇） * 1.是什么 * 2. 快速上手 * 2.1 docker安装 * 2.2 镜像启动 * 2.3 服务端启动 * 2.4 客户端测试与使用 * 3. 客户端用法详解 * 3.1 python-client * 3.2 cpp-client * 3.3 Html网页版 * 3.4 Java-client * 3.4.1 Building for Linux/Unix * 4. 服务端用法详解 * 4.1 启动FunASR服务 * 4.2 关闭FunASR服务 * 4.3 修改模型及其他参数

【智体OS】ibbot智体机灵 V1.0：你的手机AI超脑，一句话开启智体时代————终将打败OpenClaw的国产开源项目

【智体OS】ibbot智体机灵 V1.0：你的手机AI超脑，一句话开启智体时代————终将打败OpenClaw的国产开源项目发布日期：2026年2月12日核心定位：基于dtns.os V5.0的下一代移动端AI智能体平台 🚀 产品宣言：告别笨重，拥抱手机里的AI工作站还在为OpenClaw这类方案需要额外购置硬件、部署复杂而头疼吗？时代变了！ibbot智体机灵将强大的AI智能体引擎直接塞进你的安卓手机，实现 “零硬件成本、开机即用、揣兜就走” 的终极生产力形态。我们不是另一个AI工具，而是你口袋里的 “AI副驾” 和 “赚钱工作站”。 ✨ 核心亮点：为什么ibbot是颠覆者？ 1. 极致轻量与便携 * 部署平台：你正在使用的安卓手机/平板。 * 硬件成本：￥0，充分利用现有设备，无需Mac mini或云服务器。 * 便携性：你的手机就是完整的工作站，灵感随时捕捉，任务随地处理。 2. 一句话创建万物基于dtns.

工业物联网数据基础设施：Apache IoTDB 与 TimechoDB 的云原生与 AI 进化之路

工业物联网数据基础设施：Apache IoTDB 与 TimechoDB 的云原生与 AI 进化之路写在前面：AI 时代的物联网数据新范式 2025年的今天，我们谈论物联网数据管理时，已不再仅仅满足于“存得下、查得快”。当大型模型开始渗透工业场景，当 AI Agent 试图直接操作数据库进行 Root Cause Analysis，时序数据库正在经历一场从“被动存储”向“主动智能”的深刻进化。面对智慧工厂每日 50TB 的振动数据，面对千万级设备的并发接入，传统的数据库架构不仅在性能上捉襟见肘，在智能化分析层面更是断层。国产自研的 Apache IoTDB 及其企业版 TimechoDB，不仅在云原生架构上给出了高分答卷，更在 2026 年的新版本中，交出了“数据库内置 AI”的惊艳方案。一、重新审视时序数据库：

Obsidian Copilot 智能搜索：三步解锁高效笔记管理新时代

还在为海量笔记找不到关键信息而烦恼吗？Obsidian Copilot 的智能搜索功能将彻底改变你的笔记管理方式。无需建立复杂索引，通过语义理解技术，让你在数秒内精准定位任何相关笔记，实现真正的智能知识管理。【免费下载链接】obsidian-copilotA ChatGPT Copilot in Obsidian 项目地址: https://gitcode.com/gh_mirrors/ob/obsidian-copilot 🎯 你的笔记管理痛点，我们都有解决方案找不到去年的项目总结？智能搜索支持时间范围查询，只需输入"去年的项目总结"，系统会自动过滤并展示相关文档。碎片化信息难以整合？通过AI智能代理模式，自动搜索并汇总相关资料，生成结构化笔记。 ⚡ 零基础快速上手教程第一步：三步安装配置 1. 克隆官方仓库：git clone https://gitcode.com/gh_mirrors/ob/obsidian-copilot 2.

Copilot代理与网络配置全攻略（突破访问限制的终极方法）

第一章：Copilot代理与网络配置全攻略（突破访问限制的终极方法）在使用 GitHub Copilot 的过程中，开发者常因网络策略或区域限制无法正常激活服务。通过合理配置代理与网络环境，可有效绕过此类问题，确保代码补全功能稳定运行。配置本地代理服务器为确保 Copilot 能够连接至远程 API，建议在本地部署 HTTP 代理服务。以下是一个基于 Node.js 的简易代理示例： // proxy-server.js const http = require('http'); const net = require('net'); // 创建 HTTP 代理服务器 const server = http.createServer((req, res) => { // 允许跨域请求 res.setHeader(

VS2022安装Copilot保姆级教程：从登录到实战避坑指南

VS2022 深度集成 Copilot：从零配置到高效编程的完整实战手册最近在开发者圈子里，关于 AI 编程助手的讨论热度一直居高不下。对于长期使用 Visual Studio 2022 进行大型项目开发的工程师来说，能否将这股 AI 生产力无缝融入自己熟悉的 IDE 环境，直接关系到日常编码效率的提升。我身边不少朋友在初次尝试为 VS2022 配置 Copilot 时，都或多或少遇到了些“门槛”——从扩展安装、账号授权，到最终的等待激活，整个过程并非总是一帆风顺。这篇文章，正是基于我自身以及团队成员的多次实践，为你梳理出一套清晰、可复现的配置流程，并重点剖析那些容易踩坑的环节，确保你能顺利地将 Copilot 的强大代码补全与生成能力，带入到你的 Visual Studio 2022 工作流中。 1. 环境准备与 Copilot 扩展安装在开始之前，我们需要确保基础环境就绪。Visual

5步精通GPT2-Chinese：中文AI写作从入门到精通的完整教程

5步精通GPT2-Chinese：中文AI写作从入门到精通的完整教程【免费下载链接】GPT2-ChineseChinese version of GPT2 training code, using BERT tokenizer. 项目地址: https://gitcode.com/gh_mirrors/gp/GPT2-Chinese 你是否想用AI创作出优美的中文诗词、散文或小说？GPT2-Chinese正是你需要的终极工具！这个开源项目提供了完整的GPT-2中文训练代码，让你能够训练自己的中文语言模型，实现从古诗词到现代散文、从武侠小说到新闻稿件的全能创作。在本文中，我将为你提供一份简单快速的完整指南，帮助你快速掌握这个强大的中文AI写作工具。 🚀 第一步：环境配置与项目准备首先，你需要克隆GPT2-Chinese项目到本地： git clone https://gitcode.com/gh_mirrors/gp/GPT2-Chinese cd GPT2-Chinese 安装必要的依赖包： pip install -r requirements.

AIGC个性化与定制化内容生成：技术与应用的前沿探索

目录引言第一部分：个性化与定制化内容生成的技术原理 1.1 什么是个性化与定制化内容生成？ 1.2 生成式AI在个性化内容生成中的作用 1.3 数据驱动的个性化内容生成第二部分：个性化与定制化内容生成的应用领域 2.1 新闻与媒体行业 2.2 电子商务与广告 2.3 教育行业 2.4 娱乐与创意产业第三部分：AIGC个性化与定制化内容生成的技术实现 3.1 推荐系统与个性化推送算法 3.2 基于生成式模型的个性化内容生成 3.3 情感分析与定制化内容的情境化结语引言随着人工智能技术的迅猛发展，生成式AI（AIGC，Artificial Intelligence Generated Content）逐渐成为各行各业的热门话题，特别是在内容创作和个性化推荐方面。个性化和定制化内容生成作为AIGC技术的重要应用场景之一，

Cursor、Windsurf、Kiro、Zed、VS Code（含 Copilot）等 AI 编程工具的定价对比

以 USD/月为单位，2025 最新市场信息：(Windsurf) 1) Cursor（基于 VS Code 的 AI IDE）计划价格主要特征免费 Hobby$0基础 completions / 请求额度有限，试用高级功能两周 (Bito)Pro$20/月无限 completions、约 500 高速 AI 请求 (Windsurf)Teams$40/用户/月团队协作、管理功能 (Windsurf)Ultra$200/月大量 AI 请求额度 (Bito)Enterprise自定义企业级安全与支持 (Bito) 特点：AI 多行补全、上下文理解强、Pro

pycharm里copilot claude消失

在pycharm里安装了coplilot插件但模型里没有claude，在网页是存在的，查询无果，最后看到这篇帖子 https://www.cnblogs.com/tanggoahead/p/19104245 原来是限制了中国用户的访问权限所致在pycharm设置里重新把梯子的环境复制过来配置之后重启pycharm问题解决！

语音转写文本润色：Llama-Factory助力ASR结果后处理

Llama-Factory助力ASR文本后处理：让语音转写真正“可用” 在智能会议系统、庭审记录数字化、远程医疗问诊等场景中，自动语音识别（ASR）早已不再是“能不能听清”的问题，而是“转出来的文字能不能直接用”的挑战。即便现代ASR引擎的词错率已低于10%，其原始输出仍常表现为无标点、断句混乱、同音错别字频出的“口语流”，例如： “那个我们明天三点开会然后讨论项目进度请各部门负责人参加” 这样的文本显然无法直接归档或生成纪要。用户需要额外投入大量人力进行校对和润色——这不仅抵消了自动化带来的效率优势，还可能引入新的错误。于是，一个关键环节浮出水面：ASR后处理。而近年来，大语言模型（LLM）正成为这一环节的核心驱动力。不过，通用大模型如通义千问、ChatGLM虽然语法能力强，却往往对领域术语不敏感，容易“过度发挥”。真正的解法，是基于真实转写数据微调一个专用的文本修正模型。这时，Llama-Factory 出现了。它不是一个简单的训练脚本集合，而是一套完整的大模型定制流水线，把从数据准备到模型部署的复杂工程封装成可操作的工具链。更重要的是，它让没有深度学习背景的工程师也

Latest