“波动率税、伊藤定理和对数的遍历性”

最大化长期资本增长的证明——离散近似和随机微积分

在读 Ernest P. Chan 的《Quantitative Trading: How to Build Your Own Algorithmic Trading Business》时，书中有一句极其反直觉的论断：

“如果你的目标是最大化长期资本增长，最好的策略是买入并长期持有。这一说法在数学上早已被证明是错误的。”

这很让人好奇。习惯上，我们被教育要“做时间的朋友，买入并持有”。但从数学的视角来看，纯数学上真正的“时间之友”到底是谁？

尝试推导后，分别使用微积分（离散时间近似）和随机微积分（连续时间极限）给出了证明。在这个过程中，还顺便得出了两个中间结论——波动率税与伊藤引理。

为了直观呈现推导过程，下文的推导将借鉴定理证明器 Lean4 的风格：我们关注📝 假设Assumptions, 🎯当前目标Goal, 🛠️操作Operations。下面我们进入投资者小明的视角——

视角一：微积分

假设小明拥有一笔初始资金 $V_0$ ，他准备在市场中博弈 $n$ 个周期。他的终极目的是最大化长期资本增长。

1. 确立目标函数

小明的初始资金 $V_0$ ，在 $n$ 个周期里，每个周期的收益率为 $R_1, R_2, \dots, R_n$ 。小明的最终资金 $V_n$ 是每一期相乘：

V_n = V_0 \times (1+R_1) \times (1+R_2) \times \dots \times (1+R_n)=V_{0}\times (1+g)^n

最终目的是最大化长期资本增长，即最大化平均每个周期的复合增长率 $g$ （当然了扩大 $n$ 也是合理的，但是这只和身体健康有关，不是我们这里的工作。所以假设 $n$ 保持不变，比较 $g$ 是我们希望的工作）。

于是得到假设和目标——

📝 Assumptions:
- 各周期收益率为随机变量序列 $R_1, R_2, \dots, R_n$ 。
- 期末终值方程： $V_n = V_0 \times \prod_{i=1}^{n}(1+R_i)$ 。
- 投资期数 $n$ 极大，符合大数定律条件。
🎯 Goal:
- 定义并提取出长期对数复合增长率 $g$ 的数学期望表达式。
🛠️ Operations:
1. 现在的目标是求 $g$ ，考虑到连乘不方便求平均，取自然对数可以把它变成连加（假设是这个原因来引入对数，后文有更详细解答）： $\ln\left(\frac{V_n}{V_0}\right) = \ln(1+R_1) + \ln(1+R_2) + \dots + \ln(1+R_n)$ 那么，单期的长期对数复合增长率 $g$ 的期望表达式就是： $g = \frac{1}{n} \sum_{i=1}^n \ln(1+R_i)$ 因为 $n$ 极大，所以这里符合大数定律，所以引入了随机变量 $R$ ，得到了 $g = \lim_{n \to \infty} \frac{1}{n} \sum_{i=1}^n \ln(1+R_i) \approx E[\ln(1+R)]$ 至此把一个“跨越无限多期、需要成千上万个数据的平均问题”，利用大数定律，降维成了一个“只需要研究单一随机变量 $R$ 的统计期望问题”。

2. Lemma 1 泰勒展开和波动率税

$g = E[\ln(1+R)]$ 难以直接计算。尝试使用泰勒公式展开。希望找到收益率均值 $\mu$ 、方差 $\sigma^2$ 与增长率 $g$ 之间的代数关系。

📝 Assumptions:
- 单期投资收益率 $R$ 极小（如日收益率接近 0），满足泰勒展开的高阶无穷小截断条件。
- 统计量定义：预期收益 $\mu = E[R]$ 。
- 方差定义： $\sigma^2 = E[(R-\mu)^2] = E[R^2] - (E[R])^2$ 。
🎯 Goal:
- 证明 $g \approx \mu - \frac{1}{2}\sigma^2$ 。
🛠️ Operations: 1. 对 $g = E[\ln(1+R)]$ 二阶泰勒展开： $f(x) \approx f(0) + f'(0)x + \frac{f''(0)}{2!}x^{2} \rightarrow f(x)=\ln(1+x) \approx x - \frac{1}{2}x^2$ ，代入 $R$ 得 $\ln(1+R) \approx R - \frac{1}{2}R^2$ 。
2. 两边取期望： $g \approx E[R] - \frac{1}{2}E[R^2]$ 。 3. 方差近似替换： 由于 $\mu$ 极小，其平方项 $\mu^2$ 为更高阶的极小量，可忽略不计（即 $\mu^2 \approx 0$ ）。代入方差公式得到 $\sigma^2 \approx E[R^2]$ 。 4. 得出结论： $g \approx \mu - \frac{1}{2}\sigma^2$ 。

直观感悟： 小明的长期复合增长率，等于算术平均收益率减去一半的方差。无论标的涨跌，只要发生波动，复利就会产生磨损，即金融学中的“波动率税”**。

3. Theorem 1: 凯利最优杠杆与夏普比率天花板

现在，小明开始构建投资组合。

📝 Assumptions:
- 无风险利率为 $r$ 。
- 风险资产超额收益为 $\mu - r$ ，波动率为 $\sigma$ 。
- 引入资金杠杆比例 $f$ （ $f=1$ 即满仓买入并持有， $f>1$ 为借入资金）。
- 组合的超额收益为 $f(\mu - r)$ ，组合方差为 $f^2\sigma^2$ 。
🎯 Goal:
- 寻找最佳杠杆比例 $f^*$ 使得组合增长率 $g(f)$ 最大化。
- 求解极限增长率 $g_{max}$ 的表达式。
🛠️ Operations:
1. 构造目标函数： 将组合特征代入 Lemma 1 的波动率税公式，得到开口向下的二次函数： $g(f) = r + f(\mu - r) - \frac{1}{2}f^2\sigma^2$ ， $r$ 是无风险收益率， $f(\mu - r)$ 是组合的超额收益率， $f^2\sigma^2$ 是组合方差，均为常量。
2. 求一阶导寻极值： 对 $f$ 求导并令其等于 0： $\frac{d}{df} g(f) = (\mu - r) - \sigma^2 f = 0$ 得到连续时间凯利最优杠杆： $f^* = \frac{\mu - r}{\sigma^2}$ 。
3. 计算天花板并引入夏普比率： 将 $f^*$ 代回抛物线顶点，并提取夏普比率定义 $S = \frac{\mu - r}{\sigma}$ ： $g_{max} = r + \frac{1}{2}\left(\frac{\mu - r}{\sigma}\right)^2 = r + \frac{1}{2}S^2$ 。 小结： 决定长期复合增长率上限的唯一变量，是投资组合的夏普比率 $S$ 的平方，和持有时间无关。

视角二：随机微积分

第一部分的微积分证明虽然易于理解，但引入了两点误差，包括：

泰勒展开扔掉了后面的尾巴，用了约等号： $\ln(1+R) \approx R - \frac{1}{2}R^2$
强行抹掉了均值的平方，用了约等号： $E[R^2] \approx \sigma^2$

现在要做的工作是将上面的 $\approx$ 可以变成 $=$ ，具体做法是把时间切分到无穷小（变成连续时间模型）。下面开始证明：

1. Lemma 2: 连续时间的收益率

在离散世界里，我们看一天的收益率 $R$ 。在连续世界里，我们看极其微小的一瞬间（极短时间 $dt$ ）的收益率。但在金融市场里，价格不仅随时间流逝，还会随机乱跳。所以我们需要两部分来描述极短时间内的收益率：

确定性的一步（ $dt$ ）： 就像每天固定的利息，它是平滑的。
随机的一步（ $dW_t$ ）： 这代表“布朗运动”的一小步，可以把它理解为极短时间内的抛硬币（正面涨，反面跌）。所以有风险资产在极短时间内的收益率 $\frac{dP}{P}$ ，被写成这样： $\frac{dP}{P} = \mu dt + \sigma dW_t$ 这里的 $\frac{dP}{P}$ ，其实就是极短时间内的收益率，也就是我们刚才的 $R$ 。

$\mu dt$ 是这段极短时间内的确定性预期收益。
$\sigma dW_t$ 是这段极短时间内因为随机波动产生的不确定性收益（ $dW_t$ 是随机布朗运动的一小步）， $\sigma$ 就是波动率。
📝 Assumptions:
- 时间切片 $dt \to 0$ 。
- 标准布朗运动增量为 $dW_t$ ，满足 $\Delta W \sim \mathcal{N}(0, \Delta t)$ 。
- 风险资产价格遵循几何布朗运动： $\frac{dP}{P} = \mu dt + \sigma dW_t$ 。
- 无风险收益率为 $r dt$ 。
🎯 Goal:
- 写出带杠杆 $f$ 的投资组合瞬间算术收益率 $\frac{dV}{V}$ 。
🛠️ Operations:
1. 组合资产收益加权： $\frac{dV}{V} = (1-f)r dt + f(\mu dt + \sigma dW_t)$ ， $(1-f) \times (r dt)$ 是无风险资产的部分， $f(\mu dt + \sigma dW)$ 是风险资产的收益。
2. 整理可得： $\frac{dV}{V} = [r + f(\mu - r)]dt + f\sigma dW$
3. 提取确定项与随机项： 设组合总预期漂移为 $M = r + f(\mu - r)$ ，总波动为 $\sigma_p = f\sigma$ 。得到Goal： $\frac{dV}{V} = M dt + \sigma_p dW_t$ 。

2. Lemma 3: 伊藤引理 (Itô’s Lemma) 的二阶补丁

牛顿微积分隐含了“世界是光滑的”这一假设（即 $(dV)^2 \to 0$ ）。但金融市场是粗糙的布朗运动，我们必须使用伊藤微积分来求取真实的对数增长率。

📝 Assumptions:
- 对数微分的泰勒完整展开： $d(\ln V) = \frac{dV}{V} - \frac{1}{2}\left(\frac{dV}{V}\right)^2 + \dots$
- 高阶无穷小湮灭规则： $(dt)^2 = 0$ ， $(dt)(dW_t) = 0$ 。
- 随机微积分核心法则（二次变差收敛）： $(dW_t)^2 = dt$ 。
🎯 Goal:
- 严格求解对数财富的动态偏微分方程 $d(\ln V)$ 。
🛠️ Operations:
1. 计算粗糙平方项： 将 Lemma 2 的结果代入 $\left(\frac{dV}{V}\right)^2$ 。 $\left(\frac{dV}{V}\right)^2 = (M dt + \sigma_p dW_t)^2 = M^2(dt)^2 + 2M\sigma_p(dt)(dW_t) + \sigma_p^2(dW_t)^2$
2. 应用湮灭与收敛规则： 前两项归零，根据二次变差收敛，仅余最后一项。 $\left(\frac{dV}{V}\right)^2 = \sigma_p^2 dt$
3. 组装伊藤公式： 将结果代回对数展开式（连续极限下所有高阶截断误差彻底消失）。 $d(\ln V) = \left(M - \frac{1}{2}\sigma_p^2\right)dt + \sigma_p dW_t$

Theorem 2: 殊途同归的绝对极值

📝 Assumptions:
- 财富方程： $d(\ln V) = \left(M - \frac{1}{2}\sigma_p^2\right)dt + \sigma_p dW_t$ 。
- 漂移项参数还原： $M = r + f(\mu - r)$ ， $\sigma_p = f\sigma$ 。
🎯 Goal:
- 严格证明 $g_{max} = r + \frac{1}{2}S^2$ 。
🛠️ Operations:
1. 取期望消除噪音： 长期来看，布朗运动随机项 $dW_t$ 的数学期望为 0。因此我们只需关注随时间 $dt$ 累积的确定性漂移项 $g(f)$ ： $g(f) = r + f(\mu - r) - \frac{1}{2}f^2\sigma^2$ ，求导可得 $g'(f) = (\mu - r) - f\sigma^2 = 0$ ，解出顶点为 $f^* = \frac{\mu - r}{\sigma^2}$ ，即最佳杠杆比例（连续时间的凯利公式）
2. 重现抛物线顶点： 代回化简可得 $g_{max} = r + \frac{1}{2}\left(\frac{\mu - r}{\sigma}\right)^2$ 此方程与离散推演（Theorem 1）得出的目标函数完全一致。代入夏普比率，结论严格成立： $g_{max} = r + \frac{1}{2}S^2$

结论

As far as the laws of mathematics refer to reality, they are not certain; and as far as they are certain, they do not refer to reality. 只要数学定律涉及实际，它们就不是确定的；只要它们是确定的，它们就不涉及实际。

——爱因斯坦

很抱歉莫名其妙放一句爱因斯坦的话在这里，但是和我们的结论息息相关。

纯数学的结论

资本的长期复利增长，并不是单纯由高收益驱动的，而是由收益与波动的比值（夏普比率）共同决定的。在杠杆工具的存在下，“买入并持有”只有在一种极其罕见的情况下（该资产的凯利最优比例恰好等于1）才是最优解，否则，不是在承受严重的波动率损耗，就是在白白浪费资金的利用效率。

但是

既然数学上已经把“全仓持有股票”批驳得体无完肤，为什么连巴菲特、指数基金之父约翰·博格都还在疯狂推荐它？

因为以上的数学推导，建立在两个普通人绝对无法跨越的现实障碍上：

借钱不自由： 公式假设小明能以极低的无风险利率（比如 $2\%$ ）借到无限的钱。但是现实中不是这样的，一旦加上高昂的利息摩擦，曲线 $g$ 图像的右半边会瞬间垮塌。
绝对爆仓风险： 数学公式假设小明可以连续调整仓位，且价格是连续变化的。但在真实世界（比如 A 股），有千股跌停、有流动性枯竭（不符合几何布朗运动的假设）。对于曲线 $g$ 的图像，可能需要加 $5$ 到 $10$ 倍的杠杆，一旦遇到极端的“肥尾”黑天鹅，小明的资金池会被瞬间击穿（Margin Call），小明的 $g$ 直接变成 $-\infty$ （破产出局）。（）
参数估计错误： 同样的，在实际市场中， $\mu$ 和 $\sigma^2$ 并非是恒定的，过高的估算可能导致过度投资，增加破产风险。

所以，最终的结论是： 追求最大化增长的理论最优解，是“寻找最高夏普比率资产 + 上杠杆”。买入并持有股票，在数学上绝对是次优解（甚至是糟糕的解）。但对于借款成本高昂、无法承受爆仓风险的普通人来说，“买入并持有”成了他们唯一能在现实世界中活下来，且收益还凑合的“妥协解”。

还没结束而且更重要的

其实我们这里的工作推导了连续时间凯利法则（Continuous-time Kelly Criterion），这在学术界被称作 Merton’s Portfolio Problem 在对数效用函数下的经典特例。

为什么使用对数

开始回答我们的问题——因为遍历性，当然了这个概念很复杂，我们尝试举一个简单的例子说清楚即可在本文内不做深究。举例即Ensemble Average和Time Average，下面举一个简单的例子，小明在玩抛硬币的游戏，正面赢钱，反面亏钱，假设算术期望是

E(V)=0.5 \times 1.5 + 0.5 \times 0.6 = 1.05

，期望是正的，应该all in，那么有——

系综平均（Ensemble Average）：假设存在 10000 个平行宇宙，有 9999 个宇宙里的小明亏得底裤都不剩，但有 1 个宇宙里的小明连掷了 100 次正面，赚的钱多到可以买下整个地球。把那 1 个超级富豪的钱，平均分给 9999 个穷光蛋，大家的“平均期望”依然是赚 5%。
时间平均（Time Average）：在乘法（复利）的世界里，时间平均不服从加法，它服从几何平均数（Geometric Mean）： $\text{几何平均} = \sqrt[n]{(1+R_1)(1+R_2)\dots(1+R_n)}$ ，所以有真实时间平均收益： $\sqrt{1.5 \times 0.6} = \sqrt{0.9} \approx 0.948$ 。每次真实的复合增长率是负的（ $-5.2\%$ ），这就是为什么小明一定会破产。

怎么求解几何平均

下面的问题是：怎么在数学上优雅地求解几何平均数？——对数是连接“乘法世界（时间平均）”和“加法世界（概率期望）”的唯一桥梁。 我们对几何平均数取对数：

\ln(\text{几何平均}) = \ln \left( \left[ \prod_{i=1}^n (1+R_i) \right]^{\frac{1}{n}} \right)

根据对数运算法则化简得到：

\ln(\text{几何平均}) = \frac{1}{n} \sum_{i=1}^n \ln(1+R_i)

根据大数定律，当 $n \to \infty$ 时，等号右边的算术平均，刚好就等于对数收益的期望值 $E[\ln(1+R)]$ 。

小结

引入对数，实际上并不是因为“我们不方便求连乘的平均”。而是因为遍历性：

有遍历性的系统：观察一个人100天，和观察100个人同一天，结果是一样的。
没有遍历性的系统：时间平均和系综平均完全不同。单一个人的长期命运，无法用所有人的平均结果来代表。

即在复利的随机游走中，绝对财富 $V$ 是不具备“遍历性（Ergodic）”的。（因为在任意单一时间线上都可能会输成0，不能再继续变化）。 $V$ 的数学期望被极小概率的“暴富宇宙”严重扭曲，它无法代表小明在单一时间线上的真实命运。

而对数财富 $\ln(V)$ 恢复了遍历性。（通过大数定律恢复了遍历性，简单理解是在一个时间线上的时间平均值，等于同一时刻大量平行宇宙的总体平均值（期望值））。它强行把极端的“暴富”和“破产”拉平到对称的线性空间里。求解 $E[\ln(1+R)]$ （离散）或 $E[d(\ln V)]$ （连续），本质上是在计算：“在唯一真实发生的时间线里，小明的资金到底在以多快的速度进行几何级数的增长。”

其实最后的小结更像一个中间结论，因为篇幅有限，很难讲清楚对数的价值和意义，下篇博客再更。

最大化长期资本增长的证明——离散近似和随机微积分

波动率税、伊藤定理和对数的遍历性

最大化长期资本增长的证明——离散近似和随机微积分

视角一：微积分

1. 确立目标函数

2. Lemma 1 泰勒展开和波动率税

3. Theorem 1: 凯利最优杠杆与夏普比率天花板

视角二：随机微积分

1. Lemma 2: 连续时间的收益率

2. Lemma 3: 伊藤引理 (Itô’s Lemma) 的二阶补丁

Theorem 2: 殊途同归的绝对极值

结论

纯数学的结论

但是

还没结束而且更重要的

为什么使用对数

怎么求解几何平均

小结

CATALOG

FEATURED TAGS

FRIENDS