Проблемы с парсингом облачной версии 1С

DopplerWave

Новичок
Пользователь
Апр 1, 2023
1
0
1
Добрый день! Для работы необходимо написать парсер облачной конфигурации 1С, в коде использую библиотеки
BeautifulSoup4, requests и lxml
.

При вызове команды soup получаю следующий код:

Python:
<!DOCTYPE html>
<html>
<head>
<title>1C:Enterprise</title>
<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<link href="e1csys/mngsrv/favicon.ico" rel="shortcut icon"/>
<link href="e1csys/mngsrv/touchIcon.png" rel="apple-touch-icon"/>
<link color="red" href="e1csys/mngsrv/_logo.svg" rel="mask-icon"/>
<meta content="1C:Enterprise" name="application-name"/>
<meta content="#ffdd00" name="msapplication-TileColor"/>
<meta content="e1csys/mngsrv/tileSmall.png" name="msapplication-square70x70logo"/>
<meta content="e1csys/mngsrv/tileMedium.png" name="msapplication-square150x150logo"/>
<link crossorigin="use-credentials" href="manifest.json?sysver=8.3.22.1963" id="id-manifest" rel="manifest"/>
<script language="javascript" type="text/javascript">
        var BASE = "/a/sbm/1042053/ru";
        var LANG = "en";
        var REDIRECT = false;
        var OPENIDRELYINGPARTY = true;
        var SPLASHTOPBRANDINGIMAGE = false;
        var SPLASHBOTTOMBRANDINGIMAGE = false;
        var HASBRANDING = false;
        var EXITURL = "";
        var OIDCALLOWSTANDARDAUTHENTICATION = "";
        var VERSION = "8.3.22.1963";
        var VENDORPREFIX = "1c.";
        var ANSQUERY = undefined;
    </script>
</head>
<body onload="start()">
<div id="openidconnectconfig" style="display:none"></div>
<script language="javascript" type="text/javascript">
        function start()
        {
            var xhr = new XMLHttpRequest();
            xhr.onreadystatechange = function()
                {
                    if (xhr.readyState === 4)
                        setTimeout(function() { prepareResponse(xhr); }, 1);
                };
            xhr.open('GET', 'scripts/mod_bootstrap_bootstrap.js?sysver=' + VERSION, true);
            xhr.send();
        }
        /** @param {!XMLHttpRequest} xhr */
        function prepareResponse(xhr)
        {
            var contentType = xhr.getResponseHeader('content-type');
            var responseText = xhr.responseText;
            if (xhr.status !== 200)
            {
                if (contentType.indexOf('text/html') !== -1)
                    writeHTMLToDocument(responseText);
                else
                    showError(responseText);
            }
            else
            {
                if (contentType.indexOf('application/javascript') !== -1)
                {
                    eval(responseText);
                    window['initMain']();
                }
                else
                {
                    showError(responseText);
                }
            }
        }
        /** @param {string} htmlText */
        function writeHTMLToDocument(htmlText)
        {
            document.open('text/html', 'replace');
            document.write(htmlText);
            document.close();
        }
        /** @param {string} errorText */
        function showError(errorText)
        {
            if (errorText)
                alert(errorText);
        }
    </script>
</body>
</html>

Написанный код на данный момент:

Python:
import requests
from bs4 import BeautifulSoup
from time import sleep

url = "https://1cfresh.com/a/sbm/1042053/ru/"

response = requests.get(url)

soup = BeautifulSoup(response.text, "lxml") #html.parcer

Нужна помощь с тем, как парсить облачную 1С и возможно ли это вообще.
 

regnor

Модератор
Команда форума
Модератор
Июл 7, 2020
2 661
474
83
загуглите как парсить, статей куча
 

Форум IT Специалистов