对熵,编码长度,MDL,压缩,柯氏压缩器的回忆梳理。
一、熵与编码长度
本节观点
熵就是一个随机变量能够被压缩到的“平均最短编码长度”的理论极限。
如果模型的平均编码长度越短,那么他和数据的真实分布(真实熵)就越接近。因为根据 cross-entropy(交叉熵) ,它和真实熵关系是:
对熵,编码长度,MDL,压缩,柯氏压缩器的回忆梳理。
本节观点
熵就是一个随机变量能够被压缩到的“平均最短编码长度”的理论极限。
如果模型的平均编码长度越短,那么他和数据的真实分布(真实熵)就越接近。因为根据 cross-entropy(交叉熵) ,它和真实熵关系是:
H(p,q)=H(p)+KL(p∥q)
相关信息
针对 2024-2026 年初 Qwen 模型作简要摘录,具体性能待测试后完善。
相关信息
部分 scaling laws 回忆
2020 年 openai 发布了文章 Scaling Laws for Neural Language Models ,其中提到了 scaling laws。一开始的 scaling laws 针对的是 Transformer models,但后续一些讨论更倾向于自回归类型(做 NTP)的模型,文中 summary 提到了最初 scaling laws 的几个点:
但计算机只能处理离散的数字,所以要“采样 + 量化”成数字信号。
声音本质:连续的模拟信号
在最新的前端开发技术中,React 是一个非常流行且被广泛采用的 JavaScript 库 之一。React 以声明式的方式处理用户界面,使开发者能够使用组件来构建可重用和可维护的界面。这篇文章将会带你从基础入门开始,愉快的学习 React!
参考 https://react.dev/learn
编辑器:VS Code(装插件:ESLint、Prettier、React Developer Tools 浏览器扩展)
许多工具都能够创建一个 react 模板项目,如 React Router (v7)。
相关资源:github, 论文 DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language Models
# server.py
from mcp.server.fastmcp import FastMCP
from mcp.server.fastmcp.prompts import base
# Create an MCP server
mcp = FastMCP("Demo")
# Add an addition tool
@mcp.tool()
def add(a: int, b: int) -> int:
"""Add two numbers"""
return a + b
# Add a dynamic greeting resource
@mcp.resource("greeting://{name}")
def get_greeting(name: str) -> str:
"""Get a personalized greeting"""
return f"Hello, {name}!"
2023 年,妙鸭相机因其创意性的 AI 写真生成功能受到广泛关注,市场上也随之涌现了大量基于 Stable Diffusion(SD)模型的生图应用。作为一名技术爱好者,笔者在妙鸭相机发布后不久,进行了 Stable Diffusion + LoRA 的技术验证,并发现了搭建类似 AI 相机的可行性。
领导者是能够激发他人、整合资源并引导团队实现共同目标的人。他们的职责不仅是完成任务,更重要的是塑造团队的整体方向和价值观,包括: