一种更合理的投票推优设计

长久以来，简单的多票制被广泛用在基层班团各种差额推优上面。然而，这一制度是否合理呢？

进入大学以来，每学期都要参与那么几次投票：选班干部、推党校、定三好学生……投票参加的多了，各种情景都遇得到，像是台上候选人一个都不熟，但非要硬着头皮选一个的情况也时有发生。这种情况并不少见。在行政班级越来越形同虚设的现代大学之中，同班同学不一定是相互熟悉的、相互熟悉的不一定是同班同学。这种社交圈和行政建制的错配，让投票越发处于一个尴尬的地位：一方面，它的确是相对公平的推优方式，同时集体决策也有利于责任分散，不至于让推优的组织者承担什么责任；但另一方面，相互不了解的同学之间本就缺乏评价的基础，在本就没有偏好的情况下强行投票，其产生的噪声很容易淹没真正有价值的信息。

有人可能会说：不了解的同学不参加投票不就好了吗？的确，这是一种理想的解决方法。但现实中，“弃权”很容易被解释为“无声的反对”。而且相比没投某个候选人，弃权总是更显眼的（投票是匿名的，弃权却要站出来）。所以现实操作中，很少有人主动出这个头，惹这些麻烦。

这就引出了一个问题：现行多票制下的票差到底是投票者随便投产生的随机误差，还是说真的存在稳定的偏好关系？

无偏好假设下的票数分布分析

考虑一个包含 n 名候选人、m 名选民的投票场景，其中每位选民投 k 票。在”选民对候选人 i、j 无真实偏好”的假设下，每个选民对二者票差的贡献可视为随机变量：

$$ X= \begin{cases} 1 & \text{投 } i \text{ 不投 } j\\ -1 & \text{投 } j \text{ 不投 } i\\ 0 & \text{其他，即两者均不投} \end{cases} $$

因此，候选人 i 与 j 的总票数差为：

$$ D_{ij} = V_i - V_j = \sum_{t=1}^m X_t $$

在“无偏好”假设下有 $$ \mathbb E[D]=0 $$ 下面计算单个选民贡献的方差。

我们知道

$$ P(X=1) = P(i被选) × P(j不选|i被选)=\frac{k}{n} \times \frac{n-k}{n-1} $$

由对称性，有 $P(X=-1) = \frac{k}{n} \times \frac{n-k}{n-1}$

利用常见结论 $Var(X) = E(X^2) - (E(X))^2$,

$$ \mathrm{Var}(X)=2\cdot \frac{k(n-k)}{n(n-1)} $$

所以总票差的方差是

$$ \mathrm{Var}(D)=m\cdot \frac{2k(n-k)}{n(n-1)}. $$

因此当选民不太少的时候，根据中心极限定理，该票差可近似为正态分布

$$ D_{ij} \sim N\left(0,\, m\cdot \frac{2k(n-k)}{n(n-1)}\right) $$

基于上述分布，我们可以建立统计显著性判据。若票数差满足

$$ |V_i - V_j| > z \cdot \sqrt{\frac{2mk(n-k)}{n(n-1)}} $$

则可以在给定置信水平下认为选民对候选人 i、j 存在真实偏好，而非随机波动。例如，在 90% 置信水平下 z = 1.645，在 95% 置信水平下 z = 1.96。

案例分析

以上分析停留在理论阶段。现实中，上述无偏好的投票结果是否普遍呢？下面我们以笔者所在班级的两次投票结果进行检验。

案例 1：院党校推优

案例一发生在刚刚过去的2026年3月。在这次院党校推优中，共有 4 名候选人竞争 2 个名额，27 名选民参与投票，得票情况分别为 20、14、12、8 票。

我们重点分析决定入选与否的关键边界，即第 2 名与第 3 名之间的差距。

实际票数差为 $14 - 12 = 2$ 票。根据前述公式计算标准差：$\sigma = \sqrt{\frac{2\times27\times2\times2}{4\times3}} = \sqrt{18} \approx 4.24$。在 90% 置信水平下，显著性阈值为 $1.645 \times 4.24 \approx 6.98$。

由于实际票数差 2 远小于阈值 7，该差距完全不显著。从统计学角度，我们无法认为第 2 名优于第 3 名。事实上，第二名和最后一名之间的距离也只有7票，同样没有充足证据表明这二者之间存在显著区别。

案例 2：校党校推优

案例二发生在去年12月。在这次校党校推优中，共有 7 名候选人竞争 4 个名额，25 名选民参与投票，得票情况分别为 23、15、14、14、12、11、11 票。同样分析关键边界，即第 4 名与第 5 名之间的差距。

实际票数差为 $14 - 12 = 2$ 票。计算标准差：$\sigma = \sqrt{\frac{2\times25\times4\times3}{7\times6}} \approx 3.78$。在 90% 置信水平下，显著性阈值为 $1.645 \times 3.78 \approx 6.22$。

同样地，实际票数差 2 远小于阈值 6.22。且除了第一名同学得票显著较高以外，其他候选人在统计学意义上没有显著区别。

总结

这两个真实案例充分说明，在现行制度下，决定入选与否的关键边界往往落在”统计不可区分区间”内。换言之，投票结果给出了明确的排名，但这一排名在统计上并不可靠。

改进的推优方案

基于上述分析，笔者认为以候选人数量为依据可以实行两类选举方案。对于候选人较少的情况（不超过 6 人），可以直接采用排序投票制，由每位选民对所有候选人进行完整排序，从而获取选民的完整偏好信息，避免信息损失。

对于候选人较多的情况，建议采用”两轮投票制”。第一轮沿用现行的多票制，目的是快速筛选出大致范围；第二轮仅针对”争议区间”内的候选人，通过排序投票进行精细比较，确保结果的统计可靠性。这一设计的核心思想是：用低成本投票筛选大致范围，用高信息投票解决关键不确定性。

多票制的显著性筛选方法

这一方法对应两轮投票的第一轮筛选，目的是快速缩减候选人个数。

我们假设录取名额为 r，记 $V_{(r)}$ 为第 r 名（最后入选者）的票数，$V_{(r+1)}$ 为第 r+1 名（第一落选者）的票数，T 为根据置信水平计算的显著性阈值。

对于任意候选人 a，其票数 $V_a$ 可按以下规则分类： $$ \begin{cases} V_a > V_{(r+1)} + T & \text{确定入选}\\ V_a < V_{(r)} - T & \text{确定落选}\\ \text{否则} & \text{进入争议区，需第二轮投票} \end{cases} $$

即票数显著高于上界者稳定入选，票数显著低于下界者稳定落选，而中间区域在统计上无法区分，属于”模糊区”。对于落入”模糊区”的候选人，必须进入第二轮排序投票，不得仅凭第一轮票数强行排序。

例如，在一个有20个选民和20个候选人中，名额为5的差额选举中，其示意图如下。

排序票的实施方法

排序票在候选人少的情况下可以直接实施，或者经由多票筛选第二轮开展。排序票一般通过对候选人之间两两竞赛（例如对候选人A, B，如果更多选民将A排在前面，那么A胜出），统计出最后的赢家。

然而无论如何，排序票都面临以下两个问题的挑战。

其一是循环偏好问题。如图所示，A赢了B，B赢了C，但是C又赢了A。这让偏好的传递性公理不再成立，造成了BUG。

其二是这种方式也会受到不显著问题的影响。如图，虽然D看上去是最后的赢家（无入边），但实际上D对A和B的结果都不稳。在这种情况下认为D好过A,B,C这三个有稳定偏好关系的候选人可能不公平。

为了从理论上解决排序票的这些问题，我们可以按照这个方式操作：

1. 基本原理

在排序投票中，每位选民对候选人进行完整排序。对于任意两位候选人 i、j，我们统计 $D_{ij} = \#(i \succ j) - \#(j \succ i)$，其中 $\#(i \succ j)$ 表示”将 i 排在 j 前面”的选民人数。

与多票制不同，排序投票中每位选民对任意候选人对 (i, j) 的贡献是确定的：要么将 i 排在 j 前（贡献 +1），要么将 j 排在 i 前（贡献 -1）。在”选民对 i、j 无真实偏好”的假设下，每位选民以 50% 的概率选择任一顺序，因此 $D_{ij}$ 可视为 m 个独立的 ±1 随机变量之和。根据中心极限定理，$D_{ij}$ 近似服从正态分布 $N(0, m)$，标准差为 $\sqrt{m}$。

因此，若满足 $D_{ij} > z\sqrt{m}$（其中 z 为置信水平对应的临界值，如 90% 置信水平下 z = 1.645），则可以在给定置信水平下认为候选人 i 显著优于候选人 j。

2. 构建偏好关系图与最优排序

基于显著性检验，我们可以构建偏好关系图：若 $D_{ij} > T$（显著性阈值），则在图中连接有向边 $i \to j$，表示 i 显著优于 j。接下来的目标是找到一个排序 $\pi$，使其与偏好关系图最大程度一致。具体而言，我们希望最大化目标函数

$$ \sum_{i\to j} w_{ij} \cdot \mathbf{1}[\pi(i)<\pi(j)]， $$

其中权重 $w_{ij} = D_{ij} - T$意义是偏好关系的”强度”。

这一问题可以通过整数规划求解。

定义二元变量 $$ x_{ij}= \begin{cases} 1,& i \text{ 排在 } j \text{ 前}\\ 0,& i \text{ 排在 } j \text{ 后} \end{cases} $$ 表示”候选人 i 是否排在 j 前面”。

约束条件包括完全性 $x_{ij}+x_{ji}=1$ 和传递性 $x_{ij}+x_{jk}+x_{ki} \le 2$，优化目标为

$$ \max \sum_{i,j} w_{ij} \cdot x_{ij} $$

这样设计的核心思想在于：寻找违背偏好关系最少的那个方案作为最终的竞选结果。如下面所示，

左边方案将D作为第一，其造成了分值为9的违背；右边方案虽然看上去违背了更多的关系，然而因为违背的关系没有那样稳固，因此这种情况下只造成了7点违背。因此右边的方案比左边的方案更好。这样一来，循环偏好问题及弱显著性问题就被一并解决了。

使用计算机求解上述问题并不困难，可以使用枚举的方式，亦可使用可使用整数规划求解器（如Gurobi）进行求解。这些技术细节在这里就略去不表了。

总结与展望

这个提议的核心思想是用统计显著性识别不确定性，用高信息投票解决不确定性。具体而言，我建议引入统计显著性检验，避免”随机波动决定结果”的情况，确保入选者确实获得更多认可；识别”统计模糊区”，承认数据的局限性，避免对无法区分的候选人强行排序；对争议候选人采用排序投票，获取更完整的偏好信息，提高决策的可靠性；运用数学优化方法，基于偏好关系图构建最优排序，使结果更加合理、可信。

不过虽然在学理上是可行的，在现实实施中至少会遇到这样的问题。第一个是置信区间怎么选择。是95%，90%甚至是85%，这都给人为操作选举结果留下了空间。另外，尽管在代码智能体已经相当成熟的现在，编程这件事还是有一定门槛的，尤其是对大部分RUC本科生而言。如果最后的排序票需要程序实现，对一些人而言可能就成了事实上的黑箱，带来信任成本。

基于这样的考量，上述想法目前也只是一个想法，希望能够引起大家的思考。不过一个结论是明确的：现行多票制的确存在随机误差吞没真实抉择的情况。既然问题存在，那么我们就必须正视问题，尝试解决，而不是对此视而不见。

后记：成稿后，笔者向所在学院的团组织和党组织同时提交了正式的建议，在一天之内竟都收到了认真的答复。团委老师还邀请笔者当面交流看法诚然，这份意见离一份真正可落地的政策还有不远的距离，但校内党团言路畅通的状态是让人欣喜的。