Добрый день! Для работы необходимо написать парсер облачной конфигурации 1С, в коде использую библиотеки
.
При вызове команды soup получаю следующий код:
Написанный код на данный момент:
Нужна помощь с тем, как парсить облачную 1С и возможно ли это вообще.
BeautifulSoup4, requests и lxml
При вызове команды soup получаю следующий код:
Python:
<!DOCTYPE html>
<html>
<head>
<title>1C:Enterprise</title>
<meta content="text/html; charset=utf-8" http-equiv="Content-Type"/>
<meta content="IE=edge" http-equiv="X-UA-Compatible"/>
<link href="e1csys/mngsrv/favicon.ico" rel="shortcut icon"/>
<link href="e1csys/mngsrv/touchIcon.png" rel="apple-touch-icon"/>
<link color="red" href="e1csys/mngsrv/_logo.svg" rel="mask-icon"/>
<meta content="1C:Enterprise" name="application-name"/>
<meta content="#ffdd00" name="msapplication-TileColor"/>
<meta content="e1csys/mngsrv/tileSmall.png" name="msapplication-square70x70logo"/>
<meta content="e1csys/mngsrv/tileMedium.png" name="msapplication-square150x150logo"/>
<link crossorigin="use-credentials" href="manifest.json?sysver=8.3.22.1963" id="id-manifest" rel="manifest"/>
<script language="javascript" type="text/javascript">
var BASE = "/a/sbm/1042053/ru";
var LANG = "en";
var REDIRECT = false;
var OPENIDRELYINGPARTY = true;
var SPLASHTOPBRANDINGIMAGE = false;
var SPLASHBOTTOMBRANDINGIMAGE = false;
var HASBRANDING = false;
var EXITURL = "";
var OIDCALLOWSTANDARDAUTHENTICATION = "";
var VERSION = "8.3.22.1963";
var VENDORPREFIX = "1c.";
var ANSQUERY = undefined;
</script>
</head>
<body onload="start()">
<div id="openidconnectconfig" style="display:none"></div>
<script language="javascript" type="text/javascript">
function start()
{
var xhr = new XMLHttpRequest();
xhr.onreadystatechange = function()
{
if (xhr.readyState === 4)
setTimeout(function() { prepareResponse(xhr); }, 1);
};
xhr.open('GET', 'scripts/mod_bootstrap_bootstrap.js?sysver=' + VERSION, true);
xhr.send();
}
/** @param {!XMLHttpRequest} xhr */
function prepareResponse(xhr)
{
var contentType = xhr.getResponseHeader('content-type');
var responseText = xhr.responseText;
if (xhr.status !== 200)
{
if (contentType.indexOf('text/html') !== -1)
writeHTMLToDocument(responseText);
else
showError(responseText);
}
else
{
if (contentType.indexOf('application/javascript') !== -1)
{
eval(responseText);
window['initMain']();
}
else
{
showError(responseText);
}
}
}
/** @param {string} htmlText */
function writeHTMLToDocument(htmlText)
{
document.open('text/html', 'replace');
document.write(htmlText);
document.close();
}
/** @param {string} errorText */
function showError(errorText)
{
if (errorText)
alert(errorText);
}
</script>
</body>
</html>
Написанный код на данный момент:
Python:
import requests
from bs4 import BeautifulSoup
from time import sleep
url = "https://1cfresh.com/a/sbm/1042053/ru/"
response = requests.get(url)
soup = BeautifulSoup(response.text, "lxml") #html.parcer
Нужна помощь с тем, как парсить облачную 1С и возможно ли это вообще.