还在用Excel算权重？Python大神教你一键搞定，效率提升10倍！ -3K2K

还在用Excel算权重？Python大神教你一键搞定，效率提升10倍！

Python 数据分析权重计算熵权法 TOPSIS法 CRITIC法自动化数据可视化

还在为了计算评价指标权重而头疼吗？还在手动用Excel吭哧吭哧地计算吗？效率低不说，还容易出错！是时候告别这种低效的工作方式了！Python作为数据分析的利器，可以帮助你轻松搞定各种权重计算问题，效率提升10倍不在话下！

为什么选择Python计算权重？

数据量大： Excel处理大数据集容易崩溃，Python则可以轻松应对。
计算复杂： Excel公式复杂难以维护，Python代码简洁易懂，方便修改和扩展。
需要自动化： Excel操作繁琐重复，Python可以实现自动化流程，一键生成结果。
易于集成： Python可以与其他数据分析工具无缝集成，例如：pandas、numpy、matplotlib、scikit-learn等。

Python权重计算方法实战

下面我们将介绍三种常用的权重计算方法，并提供完整的Python代码示例。

1. 熵权法

熵权法是一种客观赋权法，它根据指标的信息熵来确定权重，指标的变异程度越大，权重越大。

import numpy as np
import pandas as pd

# 数据准备 (模拟数据)
data = pd.DataFrame({
    '指标1': [10, 20, 15, 25, 30],
    '指标2': [5, 10, 8, 12, 15],
    '指标3': [2, 4, 3, 5, 6]
})

# 数据标准化
def standardize(data):
    data_mean = data.mean()
    data_std = data.std()
    return (data - data_mean) / data_std

data_std = data.apply(standardize)

# 计算信息熵
def calculate_entropy(data):
    # 计算概率矩阵
    p = data / data.sum(axis=0)
    # 处理概率为0的情况，避免log0错误
    p = np.where(p == 0, 1e-6, p)
    # 计算信息熵
    entropy = -np.sum(p * np.log(p), axis=0) / np.log(data.shape[0])
    return entropy

entropy = calculate_entropy(data_std)

# 计算权重
def calculate_weights(entropy):
    weights = (1 - entropy) / np.sum(1 - entropy)
    return weights

weights = calculate_weights(entropy)

print("熵权法权重：", weights)

代码解释：

首先，我们使用pandas创建了一个DataFrame，模拟了评价指标数据。
然后，我们定义了standardize函数，对数据进行标准化处理，消除量纲影响。
接着，我们定义了calculate_entropy函数，根据标准化后的数据计算每个指标的信息熵。需要注意处理概率为0的情况，避免计算log0错误。
最后，我们定义了calculate_weights函数，根据信息熵计算每个指标的权重。

2. TOPSIS法

TOPSIS法（Technique for Order Preference by Similarity to Ideal Solution）是一种逼近理想解的排序方法，它通过比较评价对象与理想解和负理想解的距离来进行排序，距离理想解越近，距离负理想解越远，则评价对象越好。

import numpy as np
import pandas as pd
from sklearn.preprocessing import MinMaxScaler

# 数据准备 (模拟数据)
data = pd.DataFrame({
    '指标1': [10, 20, 15, 25, 30],
    '指标2': [5, 10, 8, 12, 15],
    '指标3': [2, 4, 3, 5, 6]
})

# 数据归一化
scaler = MinMaxScaler()
data_normalized = pd.DataFrame(scaler.fit_transform(data), columns=data.columns)

# 定义权重 (假设权重已知)
weights = np.array([0.4, 0.3, 0.3])

# 加权规范化
data_weighted = data_normalized * weights

# 确定正理想解和负理想解
positive_ideal_solution = data_weighted.max()
negative_ideal_solution = data_weighted.min()

# 计算距离
def calculate_distance(data, ideal_solution):
    return np.sqrt(np.sum((data - ideal_solution) ** 2, axis=1))

positive_distance = calculate_distance(data_weighted, positive_ideal_solution)
negative_distance = calculate_distance(data_weighted, negative_ideal_solution)

# 计算相对贴近度
closeness = negative_distance / (positive_distance + negative_distance)

# 排序
rank = closeness.rank(ascending=False)

print("TOPSIS法结果：", rank)

代码解释：

首先，我们使用pandas创建了一个DataFrame，模拟了评价指标数据。
然后，我们使用MinMaxScaler对数据进行归一化处理，将数据缩放到[0, 1]区间。
接着，我们定义了每个指标的权重（这里假设权重已知，实际应用中可以使用其他方法计算权重）。
然后，我们计算加权规范化矩阵，并确定正理想解和负理想解。
接着，我们定义了calculate_distance函数，计算每个评价对象与正理想解和负理想解的距离。
最后，我们计算相对贴近度，并根据相对贴近度对评价对象进行排序。

3. CRITIC法

CRITIC法(CRiteria Importance Though Intercrieria Correlation) 是一种客观赋权法，它综合考虑指标的对比强度和冲突性来确定权重，指标的对比强度越大，冲突性越小，权重越大。

import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler

# 数据准备 (模拟数据)
data = pd.DataFrame({
    '指标1': [10, 20, 15, 25, 30],
    '指标2': [5, 10, 8, 12, 15],
    '指标3': [2, 4, 3, 5, 6]
})

# 数据标准化
scaler = StandardScaler()
data_standardized = pd.DataFrame(scaler.fit_transform(data), columns=data.columns)

# 计算标准差
std = data_standardized.std()

# 计算相关系数矩阵
correlation_matrix = data_standardized.corr()

# 计算信息量
def calculate_information_amount(std, correlation_matrix):
    n = len(std)
    C = []
    for j in range(n):
        R = 0
        for i in range(n):
            R += (1 - correlation_matrix.iloc[i, j])
        C.append(std[j] * R)
    return np.array(C)

C = calculate_information_amount(std, correlation_matrix)

# 计算权重
def calculate_weights(C):
    weights = C / np.sum(C)
    return weights

weights = calculate_weights(C)

print("CRITIC法权重：", weights)

代码解释：

首先，我们使用pandas创建了一个DataFrame，模拟了评价指标数据。
然后，我们使用StandardScaler对数据进行标准化处理。
接着，我们计算标准差和相关系数矩阵。
然后，我们定义了calculate_information_amount函数，计算每个指标的信息量。信息量越大，说明该指标越重要。
最后，我们定义了calculate_weights函数，根据信息量计算每个指标的权重。

权重计算结果的应用

计算出评价指标的权重后，我们可以将权重应用到实际项目中，例如：

构建评分模型： 将权重作为指标的系数，计算综合得分。
进行数据可视化： 使用饼图或柱状图展示权重分布，直观了解指标的重要性。
生成决策报告： 在报告中说明权重计算方法和结果，为决策提供依据。

例如，使用Matplotlib进行数据可视化:

import matplotlib.pyplot as plt

# 假设我们计算得到的熵权法权重如下
weights = [0.3, 0.4, 0.3]
labels = ['指标1', '指标2', '指标3']

# 绘制饼图
plt.pie(weights, labels=labels, autopct='%1.1f%%')
plt.title('指标权重占比')
plt.show()

# 绘制柱状图
plt.bar(labels, weights)
plt.title('指标权重')
plt.xlabel('指标')
plt.ylabel('权重')
plt.show()

总结

本文介绍了如何使用Python高效计算评价指标权重，包括熵权法、TOPSIS法、CRITIC法等。Python代码简洁易懂，计算速度快，易于扩展和集成，可以帮助你快速构建评分模型、进行数据可视化，生成专业的决策报告。赶紧抛弃Excel，拥抱Python吧！