Как ускорить код? Numba?

serot

Новичок
Пользователь
Май 13, 2020
7
0
1
Подскажите как можно ускорить код? TXT файлы весят 20MB, python долго считывает их.

Пытался через библиотеку 'Numba', но слишком много действий для jit'a и выполнение завершается.

Python:
import requests
import random
from numba import njit, cuda

filenames = ['input7.txt', 'input8.txt']

def run():
    try:
        while 5 > 1:
            browser = 'Mozilla/5.0 (Windows NT 6.1; Win64; x64) ' +\
                'AppleWebKit/537.36 (KHTML, like Gecko) ' +\
                'Chrome/71.0.3578.98 Safari/537.36'
            headers = {'User-Agent': browser}
            pageNum1 = random.randrange(1,1000000)
            pageNum2 = random.randrange(1,1000000)
            fullurl = ['http://localhost/'+str(pageNum1),'http://localhost/'+str(pageNum2)]

            for url in fullurl:
                html = requests.get(url=url, headers=headers).text
                print (url)
                for filename in filenames:
                    with open(filename) as f:
                        for line in f:
                            if line.rstrip() in html:
                                print(f'Find "{line}" on the page {url}')
                                with open('find.txt', 'a') as appendFile:
                                    appendFile.write('{}\n'.format(url))
                                    appendFile.write('{}\n'.format(line))
                                return
                                
    except (ValueError):
        print ("Break")
        
run()
 

Crazy_Ostin

Пользователь
Пользователь
Июн 9, 2020
9
6
1
20
Беларусь, Брест
Для 20мб подойдёт лучше pandas
прочитай документацию - https://khashtamov.com/ru/pandas-introduction/
Код:
import pandas as pd
file = 'file_name.txt'
data = pd.read_table(file)
 
Последнее редактирование:

Форум IT Специалистов