html - python BeautifulSoup how get values between tags? -
मेरा html संरचना है:
और लेफ्टिनेंट ; Div वर्ग = "लेआउट 4-पृष्ठभूमि" & gt; & Lt; h6 वर्ग = "खेल" & gt; गेम 1 नीचे सभी सूची कैसे प्राप्त करें और वर्ग "गेम" को असाइन करें? & Lt; / h6 & gt; & LT; ul & gt; & Lt; li वर्ग = "लिस्टिंग" & gt; & Lt; / ul & gt; & LT; ul & gt; & Lt; li वर्ग = "लिस्टिंग" & gt; & Lt; / ul & gt; & LT; ul & gt; & Lt; li वर्ग = "लिस्टिंग" & gt; & Lt; / ul & gt; & Lt; h6 वर्ग = "गेम" & gt; गेम 2 नीचे सभी सूची कैसे प्राप्त करें और कक्षा "गेम? & Lt; / h6 & gt; & lt; ul & gt; & lt; li वर्ग =" लिस्टिंग "& gt; & lt; / ul & gt; & lt; h6 class =" game "& gt; गेम 3 कैसे प्रदान करें। नीचे सभी लिस्ट पाने के लिए और क्लास "गेम? & Lt; / h6 & gt; & LT; ul & gt; & Lt; li वर्ग = "लिस्टिंग" & gt; & Lt; / ul & gt; & Lt; / div & gt;
यह एक एक div ब्लॉक है असल में मुझे प्रत्येक एच 6 कक्षा की सूची बनाना होगा। पहली एच 6 - 3 लिस्टिंग, दूसरी एच 6 - 1 लिस्टिंग, तीसरी एच 6 - 1 लिस्टिंग। क्या खूबसूरत सूप के साथ ऐसा करने का एक तरीका है? धन्यवाद
आप इसका परिणाम पर पुनरावृति कर सकते हैं
तत्व: div.find_all ('h6') में हेडर के लिए itertools से आयात करें, थोड़ी देर तक, ifilter div = soup.find ('div', class_ = 'layout4-background') आयात करें: प्रिंट लिस्टिंग में लिस्टिंग के लिए header.get_text () लिस्टिंग = लेकडाइटी: टी.नाम == 'उल', हैडर.फिंड_क्वेस्ट_साइबिंग्स (टेक्स्ट = फॉल्से)): लिस्टिंग के साथ कुछ करें
find_next_siblings ()
खोज सभी नोड्स पाता है जो कि सिर्फ पाठ नोड्स नहीं हैं (बीच में व्हाइसेस्पेस लंघन)।
डेमो:
आप बस अगले तत्व जो सभी & gt; & gt; & gt; बीएस 4 आयात से सुंदरसुप & gt; & gt; & gt; इटरेटोल्स से आयात लेते समय & gt; & gt; & gt; सूप = खूबसूरत सूप ('' '\ ... & lt; div वर्ग = "लेआउट 4-पृष्ठभूमि" & gt; ... & lt; h6 class = "game" & gt; गेम 1। नीचे सभी सूची कैसे प्राप्त करें और वर्ग "गेम को असाइन करें "? & Lt; / h6 & gt; ... & lt; उल & gt; ... & lt; li वर्ग =" लिस्टिंग "& gt; ... & lt; / ul & gt; ... & lt; ul & gt; ... & lt; li वर्ग = "लिस्टिंग" & gt; ... & lt; / ul & gt; ... & lt; ul & gt; ... & lt; li वर्ग = "लिस्टिंग" & gt; ... & lt; / ul & gt; ... & lt; h6 वर्ग = " खेल "& gt; गेम 2. कैसे नीचे सभी सूचीएं प्राप्त करें और कक्षा" गेम? & Lt; / h6 & gt; ... & lt; ul & gt; ... & lt; li वर्ग = "लिस्टिंग" & gt; ... & lt; / उल & gt; ... & lt; h6 class = "game" & gt; Game3. नीचे सभी सूचीएं कैसे प्राप्त करें और वर्ग "गेम? & Lt; / h6 & gt; ... & lt; ul & gt; ... & lt; li वर्ग = "लिस्टिंग" & gt; ... & lt; / ul & gt; ... & lt; / div & gt; ... '' ')) & gt; & gt; & gt; Div = soup.find ('div', वर्ग _ = 'लेआउट 4-पृष्ठभूमि') & gt; & gt; & gt; Div.find_all ('h6') में शीर्षक के लिए: ... प्रिंट header.get_text () ... लिस्टिंग = takewhile (लैम्ब्डा टी: टी.नाम == 'उल', ... header.find_next_siblings (टेक्स्ट = False )) ... प्रिंट 'सूचीबद्ध सूची:', लेन (सूची (लिस्टिंग)) ... गेम 1। नीचे सभी सूची कैसे प्राप्त करें और वर्ग "गेम" को असाइन करें? लिस्टिंग मिली: 3 गेम 2 कैसे नीचे सभी लिस्टिंग प्राप्त करने के लिए और वर्ग "खेल को निर्दिष्ट करने के लिए? सूची में पाया: 1 Game3. नीचे सभी लिस्टिंग पाने के लिए और कक्षा" खेल को असाइन करने के लिए कैसे? लिस्टिंग मिली: 1
Comments
Post a Comment