最大化长期资本增长的证明——离散近似和随机微积分

波动率税、伊藤定理和对数的遍历性

Posted by 夏启钊 on Tuesday, April 14, 2026

“波动率税、伊藤定理和对数的遍历性”

最大化长期资本增长的证明——离散近似和随机微积分

在读 Ernest P. Chan 的《Quantitative Trading: How to Build Your Own Algorithmic Trading Business》时,书中有一句极其反直觉的论断:

“如果你的目标是最大化长期资本增长,最好的策略是买入并长期持有。这一说法在数学上早已被证明是错误的。”

这很让人好奇。习惯上,我们被教育要“做时间的朋友,买入并持有”。但从数学的视角来看,纯数学上真正的“时间之友”到底是谁?

尝试推导后,分别使用微积分(离散时间近似)和随机微积分(连续时间极限)给出了证明。在这个过程中,还顺便得出了两个中间结论——波动率税伊藤引理

为了直观呈现推导过程,下文的推导将借鉴定理证明器 Lean4 的风格:我们关注📝 假设Assumptions, 🎯当前目标Goal, 🛠️操作Operations。下面我们进入投资者小明的视角——

视角一:微积分

假设小明拥有一笔初始资金 V0V_0,他准备在市场中博弈 nn 个周期。他的终极目的是最大化长期资本增长

1. 确立目标函数

小明的初始资金 V0V_0,在 nn 个周期里,每个周期的收益率为 R1,R2,,RnR_1, R_2, \dots, R_n。小明的最终资金 VnV_n 是每一期相乘:

Vn=V0×(1+R1)×(1+R2)××(1+Rn)=V0×(1+g)nV_n = V_0 \times (1+R_1) \times (1+R_2) \times \dots \times (1+R_n)=V_{0}\times (1+g)^n

最终目的是最大化长期资本增长,即最大化平均每个周期的复合增长率 gg(当然了扩大nn也是合理的,但是这只和身体健康有关,不是我们这里的工作。所以假设nn保持不变,比较gg是我们希望的工作)。

于是得到假设和目标——

  • 📝 Assumptions:
    • 各周期收益率为随机变量序列 R1,R2,,RnR_1, R_2, \dots, R_n
    • 期末终值方程:Vn=V0×i=1n(1+Ri)V_n = V_0 \times \prod_{i=1}^{n}(1+R_i)
    • 投资期数 nn 极大,符合大数定律条件。
  • 🎯 Goal:
    • 定义并提取出长期对数复合增长率 gg 的数学期望表达式。
  • 🛠️ Operations:
    1. 现在的目标是求gg,考虑到连乘不方便求平均,取自然对数可以把它变成连加(假设是这个原因来引入对数,后文有更详细解答): ln(VnV0)=ln(1+R1)+ln(1+R2)++ln(1+Rn)\ln\left(\frac{V_n}{V_0}\right) = \ln(1+R_1) + \ln(1+R_2) + \dots + \ln(1+R_n)那么,单期的长期对数复合增长率 gg 的期望表达式就是: g=1ni=1nln(1+Ri)g = \frac{1}{n} \sum_{i=1}^n \ln(1+R_i)因为 nn 极大,所以这里符合大数定律,所以引入了随机变量RR,得到了 g=limn1ni=1nln(1+Ri)E[ln(1+R)]g = \lim_{n \to \infty} \frac{1}{n} \sum_{i=1}^n \ln(1+R_i) \approx E[\ln(1+R)]至此把一个“跨越无限多期、需要成千上万个数据的平均问题”,利用大数定律,降维成了一个“只需要研究单一随机变量 RR 的统计期望问题”。

2. Lemma 1 泰勒展开和波动率税

g=E[ln(1+R)]g = E[\ln(1+R)] 难以直接计算。尝试使用泰勒公式展开。希望找到收益率均值 μ\mu、方差 σ2\sigma^2 与增长率 gg 之间的代数关系。

  • 📝 Assumptions:
    • 单期投资收益率 RR 极小(如日收益率接近 0),满足泰勒展开的高阶无穷小截断条件。
    • 统计量定义:预期收益 μ=E[R]\mu = E[R]
    • 方差定义:σ2=E[(Rμ)2]=E[R2](E[R])2\sigma^2 = E[(R-\mu)^2] = E[R^2] - (E[R])^2
  • 🎯 Goal:
    • 证明 gμ12σ2g \approx \mu - \frac{1}{2}\sigma^2
  • 🛠️ Operations: 1. g=E[ln(1+R)]g = E[\ln(1+R)]二阶泰勒展开: f(x)f(0)+f(0)x+f(0)2!x2f(x)=ln(1+x)x12x2f(x) \approx f(0) + f'(0)x + \frac{f''(0)}{2!}x^{2} \rightarrow f(x)=\ln(1+x) \approx x - \frac{1}{2}x^2,代入 RRln(1+R)R12R2\ln(1+R) \approx R - \frac{1}{2}R^2
    2. 两边取期望: gE[R]12E[R2]g \approx E[R] - \frac{1}{2}E[R^2]。 3. 方差近似替换: 由于 μ\mu 极小,其平方项 μ2\mu^2 为更高阶的极小量,可忽略不计(即 μ20\mu^2 \approx 0)。代入方差公式得到 σ2E[R2]\sigma^2 \approx E[R^2]。 4. 得出结论: gμ12σ2g \approx \mu - \frac{1}{2}\sigma^2

直观感悟: 小明的长期复合增长率,等于算术平均收益率减去一半的方差。无论标的涨跌,只要发生波动,复利就会产生磨损,即金融学中的“波动率税”**。

3. Theorem 1: 凯利最优杠杆与夏普比率天花板

现在,小明开始构建投资组合。

  • 📝 Assumptions:

    • 无风险利率为 rr
    • 风险资产超额收益为 μr\mu - r,波动率为 σ\sigma
    • 引入资金杠杆比例 fff=1f=1 即满仓买入并持有,f>1f>1 为借入资金)。
    • 组合的超额收益为 f(μr)f(\mu - r),组合方差为 f2σ2f^2\sigma^2
  • 🎯 Goal:

    • 寻找最佳杠杆比例 ff^* 使得组合增长率 g(f)g(f) 最大化。
    • 求解极限增长率 gmaxg_{max} 的表达式。
  • 🛠️ Operations:

    1. 构造目标函数: 将组合特征代入 Lemma 1 的波动率税公式,得到开口向下的二次函数: g(f)=r+f(μr)12f2σ2g(f) = r + f(\mu - r) - \frac{1}{2}f^2\sigma^2rr是无风险收益率,f(μr)f(\mu - r)是组合的超额收益率,f2σ2f^2\sigma^2是组合方差,均为常量。
    2. 求一阶导寻极值:ff 求导并令其等于 0: ddfg(f)=(μr)σ2f=0\frac{d}{df} g(f) = (\mu - r) - \sigma^2 f = 0得到连续时间凯利最优杠杆:f=μrσ2f^* = \frac{\mu - r}{\sigma^2}
    3. 计算天花板并引入夏普比率:ff^* 代回抛物线顶点,并提取夏普比率定义 S=μrσS = \frac{\mu - r}{\sigma}gmax=r+12(μrσ)2=r+12S2g_{max} = r + \frac{1}{2}\left(\frac{\mu - r}{\sigma}\right)^2 = r + \frac{1}{2}S^2小结: 决定长期复合增长率上限的唯一变量,是投资组合的夏普比率 SS 的平方,和持有时间无关。

视角二:随机微积分

第一部分的微积分证明虽然易于理解,但引入了两点误差,包括:

  1. 泰勒展开扔掉了后面的尾巴,用了约等号:ln(1+R)R12R2\ln(1+R) \approx R - \frac{1}{2}R^2
  2. 强行抹掉了均值的平方,用了约等号:E[R2]σ2E[R^2] \approx \sigma^2

现在要做的工作是将上面的\approx可以变成==,具体做法是把时间切分到无穷小(变成连续时间模型)。下面开始证明:

1. Lemma 2: 连续时间的收益率

在离散世界里,我们看一天的收益率 RR。 在连续世界里,我们看极其微小的一瞬间(极短时间 dtdt)的收益率。但在金融市场里,价格不仅随时间流逝,还会随机乱跳。所以我们需要两部分来描述极短时间内的收益率:

  1. 确定性的一步(dtdt): 就像每天固定的利息,它是平滑的。
  2. 随机的一步(dWtdW_t): 这代表“布朗运动”的一小步,可以把它理解为极短时间内的抛硬币(正面涨,反面跌)。 所以有风险资产在极短时间内的收益率 dPP\frac{dP}{P},被写成这样: dPP=μdt+σdWt\frac{dP}{P} = \mu dt + \sigma dW_t这里的 dPP\frac{dP}{P},其实就是极短时间内的收益率,也就是我们刚才的 RR
  • μdt\mu dt 是这段极短时间内的确定性预期收益

  • σdWt\sigma dW_t 是这段极短时间内因为随机波动产生的不确定性收益dWtdW_t 是随机布朗运动的一小步),σ\sigma 就是波动率。

  • 📝 Assumptions:

    • 时间切片 dt0dt \to 0
    • 标准布朗运动增量为 dWtdW_t,满足 ΔWN(0,Δt)\Delta W \sim \mathcal{N}(0, \Delta t)
    • 风险资产价格遵循几何布朗运动:dPP=μdt+σdWt\frac{dP}{P} = \mu dt + \sigma dW_t
    • 无风险收益率为 rdtr dt
  • 🎯 Goal:

    • 写出带杠杆 ff 的投资组合瞬间算术收益率 dVV\frac{dV}{V}
  • 🛠️ Operations:

    1. 组合资产收益加权: dVV=(1f)rdt+f(μdt+σdWt)\frac{dV}{V} = (1-f)r dt + f(\mu dt + \sigma dW_t)(1f)×(rdt)(1-f) \times (r dt)是无风险资产的部分,f(μdt+σdW)f(\mu dt + \sigma dW)是风险资产的收益。
    2. 整理可得: dVV=[r+f(μr)]dt+fσdW\frac{dV}{V} = [r + f(\mu - r)]dt + f\sigma dW
    3. 提取确定项与随机项: 设组合总预期漂移为 M=r+f(μr)M = r + f(\mu - r),总波动为 σp=fσ\sigma_p = f\sigma。得到Goal: dVV=Mdt+σpdWt\frac{dV}{V} = M dt + \sigma_p dW_t

2. Lemma 3: 伊藤引理 (Itô’s Lemma) 的二阶补丁

牛顿微积分隐含了“世界是光滑的”这一假设(即 (dV)20(dV)^2 \to 0)。但金融市场是粗糙的布朗运动,我们必须使用伊藤微积分来求取真实的对数增长率。

  • 📝 Assumptions:
    • 对数微分的泰勒完整展开:d(lnV)=dVV12(dVV)2+d(\ln V) = \frac{dV}{V} - \frac{1}{2}\left(\frac{dV}{V}\right)^2 + \dots
    • 高阶无穷小湮灭规则:(dt)2=0(dt)^2 = 0(dt)(dWt)=0(dt)(dW_t) = 0
    • 随机微积分核心法则(二次变差收敛): (dWt)2=dt(dW_t)^2 = dt
  • 🎯 Goal:
    • 严格求解对数财富的动态偏微分方程 d(lnV)d(\ln V)
  • 🛠️ Operations:
    1. 计算粗糙平方项: 将 Lemma 2 的结果代入 (dVV)2\left(\frac{dV}{V}\right)^2(dVV)2=(Mdt+σpdWt)2=M2(dt)2+2Mσp(dt)(dWt)+σp2(dWt)2\left(\frac{dV}{V}\right)^2 = (M dt + \sigma_p dW_t)^2 = M^2(dt)^2 + 2M\sigma_p(dt)(dW_t) + \sigma_p^2(dW_t)^2
    2. 应用湮灭与收敛规则: 前两项归零,根据二次变差收敛,仅余最后一项。 (dVV)2=σp2dt\left(\frac{dV}{V}\right)^2 = \sigma_p^2 dt
    3. 组装伊藤公式: 将结果代回对数展开式(连续极限下所有高阶截断误差彻底消失)。 d(lnV)=(M12σp2)dt+σpdWtd(\ln V) = \left(M - \frac{1}{2}\sigma_p^2\right)dt + \sigma_p dW_t

Theorem 2: 殊途同归的绝对极值

  • 📝 Assumptions:
    • 财富方程:d(lnV)=(M12σp2)dt+σpdWtd(\ln V) = \left(M - \frac{1}{2}\sigma_p^2\right)dt + \sigma_p dW_t
    • 漂移项参数还原:M=r+f(μr)M = r + f(\mu - r)σp=fσ\sigma_p = f\sigma
  • 🎯 Goal:
    • 严格证明 gmax=r+12S2g_{max} = r + \frac{1}{2}S^2
  • 🛠️ Operations:
    1. 取期望消除噪音: 长期来看,布朗运动随机项 dWtdW_t 的数学期望为 0。因此我们只需关注随时间 dtdt 累积的确定性漂移项 g(f)g(f)g(f)=r+f(μr)12f2σ2g(f) = r + f(\mu - r) - \frac{1}{2}f^2\sigma^2,求导可得 g(f)=(μr)fσ2=0g'(f) = (\mu - r) - f\sigma^2 = 0,解出顶点为 f=μrσ2f^* = \frac{\mu - r}{\sigma^2},即最佳杠杆比例(连续时间的凯利公式)
    2. 重现抛物线顶点: 代回化简可得 gmax=r+12(μrσ)2g_{max} = r + \frac{1}{2}\left(\frac{\mu - r}{\sigma}\right)^2此方程与离散推演(Theorem 1)得出的目标函数完全一致。代入夏普比率,结论严格成立: gmax=r+12S2g_{max} = r + \frac{1}{2}S^2

结论

As far as the laws of mathematics refer to reality, they are not certain; and as far as they are certain, they do not refer to reality. 只要数学定律涉及实际,它们就不是确定的;只要它们是确定的,它们就不涉及实际。

——爱因斯坦

很抱歉莫名其妙放一句爱因斯坦的话在这里,但是和我们的结论息息相关。

纯数学的结论

资本的长期复利增长,并不是单纯由高收益驱动的,而是由收益与波动的比值(夏普比率)共同决定的。在杠杆工具的存在下,“买入并持有”只有在一种极其罕见的情况下(该资产的凯利最优比例恰好等于1)才是最优解,否则,不是在承受严重的波动率损耗,就是在白白浪费资金的利用效率。

但是

既然数学上已经把“全仓持有股票”批驳得体无完肤,为什么连巴菲特、指数基金之父约翰·博格都还在疯狂推荐它?

因为以上的数学推导,建立在两个普通人绝对无法跨越的现实障碍上:

  1. 借钱不自由: 公式假设小明能以极低的无风险利率(比如 2%2\%)借到无限的钱。但是现实中不是这样的,一旦加上高昂的利息摩擦,曲线 gg 图像的右半边会瞬间垮塌。
  2. 绝对爆仓风险: 数学公式假设小明可以连续调整仓位,且价格是连续变化的。但在真实世界(比如 A 股),有千股跌停、有流动性枯竭(不符合几何布朗运动的假设)。对于曲线 gg 的图像,可能需要加 551010 倍的杠杆,一旦遇到极端的“肥尾”黑天鹅,小明的资金池会被瞬间击穿(Margin Call),小明的 gg 直接变成 -\infty(破产出局)。()
  3. 参数估计错误: 同样的,在实际市场中,μ\muσ2\sigma^2并非是恒定的,过高的估算可能导致过度投资,增加破产风险。

所以,最终的结论是: 追求最大化增长的理论最优解,是“寻找最高夏普比率资产 + 上杠杆”。 买入并持有股票,在数学上绝对是次优解(甚至是糟糕的解)。 但对于借款成本高昂、无法承受爆仓风险的普通人来说,“买入并持有”成了他们唯一能在现实世界中活下来,且收益还凑合的“妥协解”

还没结束而且更重要的

其实我们这里的工作推导了连续时间凯利法则(Continuous-time Kelly Criterion),这在学术界被称作 Merton’s Portfolio Problem 在对数效用函数下的经典特例。

为什么使用对数

开始回答我们的问题——因为遍历性,当然了这个概念很复杂,我们尝试举一个简单的例子说清楚即可在本文内不做深究。举例即Ensemble Average和Time Average,下面举一个简单的例子,小明在玩抛硬币的游戏,正面赢钱,反面亏钱,假设算术期望是

E(V)=0.5×1.5+0.5×0.6=1.05E(V)=0.5 \times 1.5 + 0.5 \times 0.6 = 1.05

,期望是正的,应该all in,那么有——

  • 系综平均(Ensemble Average):假设存在 10000 个平行宇宙,有 9999 个宇宙里的小明亏得底裤都不剩,但有 1 个宇宙里的小明连掷了 100 次正面,赚的钱多到可以买下整个地球。 把那 1 个超级富豪的钱,平均分给 9999 个穷光蛋,大家的“平均期望”依然是赚 5%。
  • 时间平均(Time Average):在乘法(复利)的世界里,时间平均不服从加法,它服从几何平均数(Geometric Mean): 几何平均=(1+R1)(1+R2)(1+Rn)n\text{几何平均} = \sqrt[n]{(1+R_1)(1+R_2)\dots(1+R_n)},所以有真实时间平均收益:1.5×0.6=0.90.948\sqrt{1.5 \times 0.6} = \sqrt{0.9} \approx 0.948。每次真实的复合增长率是负的(5.2%-5.2\%),这就是为什么小明一定会破产。

怎么求解几何平均

下面的问题是:怎么在数学上优雅地求解几何平均数?——对数是连接“乘法世界(时间平均)”和“加法世界(概率期望)”的唯一桥梁。 我们对几何平均数取对数:

ln(几何平均)=ln([i=1n(1+Ri)]1n)\ln(\text{几何平均}) = \ln \left( \left[ \prod_{i=1}^n (1+R_i) \right]^{\frac{1}{n}} \right)

根据对数运算法则化简得到:

ln(几何平均)=1ni=1nln(1+Ri)\ln(\text{几何平均}) = \frac{1}{n} \sum_{i=1}^n \ln(1+R_i)

根据大数定律,当 nn \to \infty 时,等号右边的算术平均,刚好就等于对数收益的期望值 E[ln(1+R)]E[\ln(1+R)]

小结

引入对数,实际上并不是因为“我们不方便求连乘的平均”。而是因为遍历性:

  • 有遍历性的系统:观察一个人100天,和观察100个人同一天,结果是一样的。
  • 没有遍历性的系统:时间平均和系综平均完全不同。单一个人的长期命运,无法用所有人的平均结果来代表。

即在复利的随机游走中,绝对财富 VV 是不具备“遍历性(Ergodic)”的。(因为在任意单一时间线上都可能会输成0,不能再继续变化)。 VV 的数学期望被极小概率的“暴富宇宙”严重扭曲,它无法代表小明在单一时间线上的真实命运。

对数财富 ln(V)\ln(V) 恢复了遍历性。通过大数定律恢复了遍历性,简单理解是在一个时间线上的时间平均值,等于同一时刻大量平行宇宙的总体平均值(期望值))。它强行把极端的“暴富”和“破产”拉平到对称的线性空间里。求解 E[ln(1+R)]E[\ln(1+R)](离散)或 E[d(lnV)]E[d(\ln V)](连续),本质上是在计算:“在唯一真实发生的时间线里,小明的资金到底在以多快的速度进行几何级数的增长。”

其实最后的小结更像一个中间结论,因为篇幅有限,很难讲清楚对数的价值和意义,下篇博客再更。