优质文章学习记录 - 极客日志 (Page 9)

AIGC工具助力2D游戏美术全流程

本文将介绍如何利用国内AIGC工具生成2D游戏开发所需的各种素材，从UI到动画，一站式解决你的游戏美术需求。为什么选择AIGC生成游戏素材？传统游戏美术制作需要投入大量时间和资金，而AIGC工具的出现彻底改变了这一局面。它让独立开发者和小团队也能获得高质量美术资源，大幅降低开发门槛和成本。国内主流AIGC工具推荐 1. 腾讯混元游戏视觉生成平台（腾讯）：专为游戏行业打造的工业级AIGC生产引擎，支持文生图、图生图、透明通道图生成，并能根据单张原画智能生成角色多视图及360°展示视频，大幅提升游戏美术资产制作效率 2. Holopix AI（广州市光绘科技有限公司）：针对游戏开发者优化的AI生图工具，支持线稿生成、局部重绘、相似图裂变（统一角色风格）、线稿提取及4K高清输出，生成的素材可直接用于Unity/UE引擎。 3. 即梦AI（字节跳动火山引擎/剪映旗下）：支持文生图、视频及动态内容生成，内置游戏场景模板（如RPG城镇、MOBA野区），擅长国风场景和2D剧情插画，每日提供免费积分。 4. 可灵AI（快手）：核心能力为静态图转动态视频，擅长角色技能演示、场景

Whisper语音识别完整部署终极指南：从零到实战

Whisper语音识别完整部署终极指南：从零到实战【免费下载链接】WhisperHigh-performance GPGPU inference of OpenAI's Whisper automatic speech recognition (ASR) model 项目地址: https://gitcode.com/gh_mirrors/wh/Whisper Whisper是一款高性能GPGPU加速的语音识别工具，基于OpenAI的自动语音识别(ASR)模型构建。本指南将带你从零开始完成Whisper的部署与实战应用，让你快速掌握这一强大工具的使用方法。 🚀 快速了解Whisper Whisper项目提供了高效的语音识别解决方案，支持多种语言和多种输入方式。其核心优势在于利用GPU加速实现快速准确的语音转文字功能，适用于从个人使用到企业级应用的各种场景。项目主要组件包括： * 核心语音识别引擎：Whisper/ * 桌面应用程序：Examples/WhisperDesktop/ * 命令行工具：Examples/main/ * C# API封装：Whisp

终于把LLaMA 2跑起来了，然后呢？本地大模型部署的残酷真相！

“终于把LLaMA 2跑起来了！” 深夜11点，程序员小林在朋友圈晒出电脑屏幕截图——黑色命令行窗口里，一行行代码滚动后，本地大模型吐出了第一句回答。他兴奋地刷新着评论区，看着“大佬”“技术牛”的赞美，感觉自己摸到了AI时代的“核心门槛”。可这份热情没能撑过一个月。如今，那台专门升级了显卡的电脑，大模型程序静静躺在硬盘深处，偶尔开机，也只是为了清理缓存。“生成一句话要等10秒，写周报还能把部门名写错，不如直接用GPT-4 API，3秒出结果还靠谱。”小林的话，道出了无数本地部署玩家的心声。 2023年以来，“本地部署大模型”成了AI圈的热门话题。从技术博主的“手把手教程”，到论坛里的“配置交流帖”，仿佛人人都能拥有一台“私人AI服务器”。但热闹背后，是一场无声的“弃坑潮”：某技术社区调研显示，70%的个人用户在部署完成后3个月内停止使用，曾经的“技术勋章”，最终沦为“电子垃圾”。这股热情的消退，绝非偶然。当“掌控AI”

SmolVLA高算力适配：TensorRT加速可行性分析与ONNX导出实操

SmolVLA高算力适配：TensorRT加速可行性分析与ONNX导出实操 1. 项目背景与核心价值 SmolVLA作为一款专为经济实惠机器人技术设计的紧凑型视觉-语言-动作模型，在资源受限环境下展现出了令人印象深刻的性能。这个约5亿参数的模型能够同时处理视觉输入、语言指令和动作输出，为机器人控制提供了端到端的解决方案。在实际部署中，我们经常面临一个关键挑战：如何在保持模型精度的同时，进一步提升推理速度以满足实时控制需求？这就是TensorRT加速技术发挥作用的地方。通过将SmolVLA模型转换为TensorRT引擎，我们有望获得显著的性能提升，特别是在NVIDIA GPU硬件上。本文将带你深入了解SmolVLA模型的TensorRT加速可行性，并提供详细的ONNX导出实操指南，帮助你在自己的机器人项目中实现更高效的推理性能。 2. TensorRT加速技术解析 2.1 TensorRT的核心优势 TensorRT是NVIDIA推出的高性能深度学习推理优化器和运行时库，它通过多种技术手段提升模型推理效率： * 图层融合：将多个连续的操作层合并为单个内核，减少内

GitHub Copilot的最新更新：从代码补全到需求理解

Copilot需求理解演进 ⚡ 核心摘要 * 核心演进: Copilot已从代码补全工具，演进为能深度把握开发者意图的AI开发助手。 * 关键技术: 其能力飞跃依赖于模型升级、多Agent系统和代码库索引三项核心技术突破。 * 实际影响: 显著提升开发效率（增益26%-35%）和代码质量（正确率提升至46.3%）。 GitHub Copilot自2021年推出以来，经历了从简单的代码补全工具到全面的AI开发助手的质变。这一演进不仅体现在技术能力的提升上，更反映了AI在软件开发领域应用的深刻变革。当前GitHub Copilot已成功从"代码补全"阶段跨越至"需求理解"阶段，通过融合多Agent系统、代码库索引和多模态能力，实现了对开发者意图的深度把握和对复杂开发任务的自主执行。本文将深入分析GitHub Copilot的功能演进路径，剖析其需求理解的核心技术突破，并评估这些创新对开发者工作效率和代码质量的实际影响，同时展望其在AI开发助手领域的创新定位与未来发展趋势。关键结论 (Key Takeaway) 当前GitHub Copilot已成功从"代码补全"阶段跨越至

Llama-Factory如何设置保存频率？按epoch或step自由设定

Llama-Factory如何设置保存频率？按epoch或step自由设定在大模型微调的实践中，最让人“又爱又怕”的莫过于漫长的训练过程。爱的是模型逐渐收敛、性能提升的成就感；怕的是一旦断电、显存溢出或者远程连接中断，几天的心血可能付诸东流。这时候，一个灵活可靠的检查点（Checkpoint）保存机制就成了救命稻草。 Llama-Factory 作为当前最受欢迎的开源大模型微调框架之一，不仅支持 LLaMA、Qwen、Baichuan 等主流架构的全参数微调与 LoRA/QLoRA 高效微调，还在训练控制上做到了极致精细——尤其是对模型保存频率的自由配置，真正实现了“想什么时候保存就什么时候保存”。从一次崩溃说起：为什么保存频率如此重要？设想这样一个场景：你正在对 Qwen-7B 进行指令微调，数据集有 10 万条，batch size 设为 4，梯度累积步数为 8，预计要跑 2 万 step 才能收敛。训练到第

知网AIGC检测怎么过？2026最新降AI率全流程攻略

知网AIGC检测怎么过？2026最新降AI率全流程攻略今年答辩季最让人头疼的事，不是论文写不出来，而是写出来过不了AIGC检测。尤其是知网。 2026年知网的AIGC检测系统又升级了，身边好几个同学的论文，之前在其他平台检测AI率只有10%出头，结果到知网一测直接飙到40%以上。搞得整个宿舍楼都弥漫着一股焦虑的气息。我自己也经历了这个过程，最后顺利过了检测。今天把整个流程整理出来，从理解检测原理到实际操作步骤，争取让你看完就知道该怎么做。先搞懂：知网AIGC检测到底在查什么很多人一听"AI检测"就慌，但其实搞明白它的检测逻辑之后，你会发现它并没有那么神秘。知网的AIGC检测大致是从这几个维度来判断的：语言模型的困惑度。简单说就是，一段文字如果太"通顺"了，AI检测系统反而会觉得可疑。因为AI生成的文字有一个特点——它总是选择概率最高的下一个词。这就导致AI写的内容在语言模型看来"毫不意外"，困惑度很低。而人写的东西偶尔会蹦出一些意想不到的表达，困惑度相对高一些。文本的统计特征。包括词汇丰富度、句子长度分布、段落结构等。AI生成的文字在这些统计指标

在昇腾 NPU 上跑 Llama 大模型：从 “踩坑到通关” 的全程实战记

在昇腾 NPU 上跑 Llama 大模型：从 “踩坑到通关” 的搞笑实战记本文分享了在昇腾 NPU 上部署测试 Llama-2-7B 大模型的全过程。提供踩坑经验。作者因其他硬件价格高、服务器昂贵，选择昇腾 NPU，其自主可控的达芬奇架构、完善的开源生态及 GitCode 免费测试资源是主要吸引力。文中详细介绍了 GitCode 上创建昇腾 Notebook 实例的关键配置、环境验证方法，以及安装 transformers 库、下载部署模型的步骤，还记录了遇到的 “torch.npu 找不到”“模型下载需权限” 等四个常见问题及解决方案。通过测试英文生成、中文对话、代码生成三种场景，得出 16-17 tokens/s 的吞吐量，虽低于预期但性能稳定，并给出使用 MindSpeed-LLM 框架、

AIGC与现代教育技术

目录引言一、AIGC在教育技术中的基本概念 1.1 什么是AIGC？ 1.2 传统教育技术和AIGC的对比二、实现过程：AIGC在现代教育中的实现 2.1 自动生成课件内容 2.1.1 代码示例：使用GPT生成教学文案 2.1.2 完善自动生成资料 2.1.3 多模态内容生成 2.2 数据高效分析和自动提供学习计划 2.2.1 数据学习分析 2.2.2 自动生成学习计划三、应用场景 3.1 K12教育示例：自动生成数学题目 3.2 高等教育

使用 VS Code 和 Android Studio 阅读 Android 源码：基于 Copilot 的高效代码分析技巧

1. 背景在日常开发中，大家常用 AI 工具（如 ChatGPT、DeepSeek 等）进行代码分析。但通过网页 AI 工具分析代码时，缺乏上下文，需要手动分段粘贴代码，效率低且容易遗漏关键信息。公司引入 Copilot 后，大家多在 VS Code、Android Studio 等 IDE 插件中用 Copilot 进行代码分析。Copilot 能直接分析当前编辑器中的代码，并支持上下文，极大提升了分析效率，减少了人工粘贴的麻烦。但实际开发中，仍存在以下痛点： * 代码跳转不连贯：对于 Android.bp soong 构建系统下的 Android 代码，不能自由地跳转到方法定义、实现、符号等。 * 查找方法繁琐：大部分

AI写论文引用的文献是真的吗？别再被“幻觉引用”坑了！宏智树AI：所有参考文献均来自知网/维普，真实可查，AIGC率＜10%

“AI写的论文，参考文献靠谱吗？” 这是许多本科生、研究生在使用智能写作工具时最担心的问题。你可能已经遇到过这样的场景： * AI生成了一篇“看起来很专业”的论文，引用了10篇文献； * 你满怀信心地复制进Word，准备写综述； * 结果一搜标题——根本不存在！ * 作者名字像真的一样，期刊名也像正规刊物，但无论知网、万方还是百度学术，都查不到原文。这种现象，学术界称之为 “幻觉引用”（Hallucinated Citations）——是通用大模型因训练数据混杂、缺乏事实核查机制而产生的“一本正经地胡说八道”。而一旦你把这类“虚假文献”写进毕业论文，轻则被导师退回，重则被认定为学术不端——因为虚构参考文献，属于严重违反科研诚信的行为。那么，有没有一个AI工具，既能高效辅助写作，又能100%保证引用真实、可查、可溯源？答案是：有。宏智树 AI 学术（www.hzsxueshu.com 平台的“毕业论文”

8卡RTX 5090服务器llama.cpp测试

8 卡 RTX 5090 服务器完整安装及性能调优指南 8卡RTX 5090服务器从 NVIDIA驱动安装 → CUDA环境 → llama.cpp编译 → 多GPU测试的完整、可直接执行流程（基于Ubuntu 22.04 LTS，适配Blackwell架构）。一、系统与硬件准备（必做） 1.1 系统要求 • 推荐：Ubuntu 22.04 LTS（64位） • 内核：6.8+ HWE内核（5090必须高内核） • 禁用：Nouveau开源驱动（与NVIDIA驱动冲突） 1.2 硬件检查 Bash # 查看8张5090是否被识别 lspci | grep -i nvidia