[SOLVED] 代写 python Question 2: Fuzzymatch with multiprocessing (15 points)

30 $

File Name: 代写_python_Question_2:_Fuzzymatch_with_multiprocessing_(15_points).zip
File Size: 649.98 KB

SKU: 3543611293 Category: Tags: , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , ,

Or Upload Your Assignment Here:


Question 2: Fuzzymatch with multiprocessing (15 points)

您将获得两个csv文件作为输入:acquiders.csv和bank_names.csv。

对于每个给定的收单机构,请使用fuzzymatch包中的fuzz.token_set_ratio将其与五个相似度最高的银行名称进行匹配。

请准备fuzzy_output.csv作为包含所有匹配结果的输出。第1列表示最高相似性,第2列表示第二高相似性,第3列、第4列和第5列的相似性也相同。

应该使用多处理库中的Pool函数来加快运行时间。然后程序将并行处理每一行收单机构数据。请将池函数中的进程数设置为multiprocessing.cpu_count()–1。也就是说,如果你的电脑有四个内核,那么它会用三个进程运行代码。在另一台具有8个内核的计算机上运行的同一代码将运行7个进程。

确保主函数中必须包含池函数之后的所有代码行,以确保程序能够顺利运行。

您也可以在不使用多处理库的情况下执行此模糊匹配,但最多只能获得10分。您获得的学分将取决于代码的质量以及运行时间。必要时包括注释。

推荐的库:fuzzywuzzy、pandas、多处理

请在Anaconda提示符或终端中键入pip install fuzzywuzzy和pip install python levenshtein(如果尚未安装)。

输出格式
Acquirer
1
2
3
4
5
Acq_1
Bank_11
Bank_12
Bank_13
Bank_14
Bank_15
Acq_2
Bank_21
Bank_22
Bank_23
Bank_24
Bank_25
Acq_3
Bank_31
Bank_32
Bank_33
Bank_34
Bank_35

Reviews

There are no reviews yet.

Only logged in customers who have purchased this product may leave a review.

Shopping Cart
[SOLVED] 代写 python Question 2: Fuzzymatch with multiprocessing (15 points)
30 $