我有两个数据集。一是假设维修说明
Electric Component keyboard replacement
Run Code Online (Sandbox Code Playgroud)
第二个数据集是所有客户的所有维修描述,这些客户之前有维修短语,后来有一些维修描述。例如:
Electric Keyboard replace
Monitor Component Replacement
Mouse component
Wire Replacement
PIN part
Run Code Online (Sandbox Code Playgroud)
所以对于这个例子,我希望它从第二组中选择“Electric Keyboard replace”作为与“Electric Component keyboard replacement”最相似的短语
DATA NAME;
INFILE DATALINES DSD;
length FIRST $ 1000;
INPUT FIRST $;
DATALINES;
Electric Component keyboard replacement
;
DATA COMPONENT;
INFILE DATALINES DSD;
length FIRST_B $ 1000;
INPUT FIRST_B $;
DATALINES;
Electric Keyboard replace
Monitor Component Replacement
Mouse component
Wire Replacement
PIN part
;
PROC SQL;
CREATE TABLE Possible_Matches AS
SELECT *
FROM Name AS n, …Run Code Online (Sandbox Code Playgroud) 这就是我正在尝试执行的转换。
为了说明,我把它做成了桌子。基本上前三列应该重复,无论有多少颜色可用。

我搜索了类似的问题,但在我想要重复多列时找不到。
我在网上找到了这个代码
Sub createData()
Dim dSht As Worksheet
Dim sSht As Worksheet
Dim colCount As Long
Dim endRow As Long
Dim endRow2 As Long
Set dSht = Sheets("Sheet1") 'Where the data sits
Set sSht = Sheets("Sheet2") 'Where the transposed data goes
sSht.Range("A2:C60000").ClearContents
colCount = dSht.Range("A1").End(xlToRight).Column
'// loops through all the columns extracting data where "Thank" isn't blank
For i = 2 To colCount Step 2
endRow = dSht.Cells(1, i).End(xlDown).Row
For j = 2 To endRow
If dSht.Cells(j, i) …Run Code Online (Sandbox Code Playgroud) 我想捕获通过python读取时在excel文件中过滤的字段或列名称。我发现我们还可以使用 openpyxl 并使用 hide == False 来仅捕获过滤后的行(How to importfiltered excel table into python?)。在我的项目中,确定 excel 文件中过滤了哪个字段/列非常重要。是否可以?以及如何实现?添加一个例子。
pip install openpyxl
from openpyxl import load_workbook
wb = load_workbook('test_filter_column.xlsx')
ws = wb['data']
Run Code Online (Sandbox Code Playgroud)
所以我期望的是我的输出应该给出经过过滤的性别。如果过滤了多个字段,则期望提供所有过滤后的列名称。