当前位置: 代码迷 >> python >> 如何通过文本值名称解析xml数据? 通过python minidom
  详细解决方案

如何通过文本值名称解析xml数据? 通过python minidom

热度:105   发布时间:2023-07-16 10:30:36.0

xml是这样的,我如何解析出字典数据,例如:

{“文本”:“大家听。”,“字体”:“ Arial”,“大小”:20}

标签名称始终是“名称”和“值”,我知道python xml模块中有诸如getElementsByTagName之类的方法,请问有什么方法可以做到这一点?

                <effect>
                    <name>Text</name>
                    <effectid>Text</effectid>
                    <effectcategory>Text</effectcategory>
                    <effecttype>generator</effecttype>
                    <mediatype>video</mediatype>
                    <parameter>
                        <parameterid>str</parameterid>
                        <name>Text</name>
                        <value>Everyone listen up.</value>
                    </parameter>
                    <parameter>
                        <parameterid>fontname</parameterid>
                        <name>Font</name>
                        <value>Arial</value>
                    </parameter>
                    <parameter>
                        <parameterid>fontsize</parameterid>
                        <name>Size</name>
                        <valuemin>0</valuemin>
                        <valuemax>1000</valuemax>
                        <value>20</value>
                    </parameter>
                    <parameter>
                        <parameterid>fontstyle</parameterid>
                        <name>Style</name>
                        <valuemin>1</valuemin>
                        <valuemax>4</valuemax>
                        <valuelist>
                            <valueentry>
                                <name>Plain</name>
                                <value>1</value>
                            </valueentry>
                            <valueentry>
                                <name>Bold</name>
                                <value>2</value>
                            </valueentry>
                            <valueentry>
                                <name>Italic</name>
                                <value>3</value>
                            </valueentry>
                            <valueentry>
                                <name>Bold/Italic</name>
                                <value>4</value>
                            </valueentry>
                        </valuelist>
                        <value>1</value>
                    </parameter>
                </effect>

使用xml.dom.minidom解析xml从来都不是一件有趣的事(请真正考虑使用 , 或 )。

这是您应该开始的地方:

from pprint import pprint
from xml.dom.minidom import parse, Text, parseString

data = """your xml goes here"""

dom = parseString(data)

result = {}

effect = dom.getElementsByTagName('effect')[0]
result['name'] = effect.getElementsByTagName('name')[0].firstChild.nodeValue

parameters = []
for parameter in effect.getElementsByTagName('parameter'):
    id = parameter.getElementsByTagName('parameterid')[0].firstChild.nodeValue
    name = parameter.getElementsByTagName('name')[0].firstChild.nodeValue
    value = parameter.getElementsByTagName('value')[0].firstChild.nodeValue
    parameters.append({'id': id, 'name': name, 'value': value})

result['parameters'] = parameters

pprint(result)

打印:

{'name': u'Text',
 'parameters': [{'id': u'str', 'name': u'Text', 'value': u'Everyone listen up.'},
                {'id': u'fontname', 'name': u'Font', 'value': u'Arial'},
                {'id': u'fontsize', 'name': u'Size', 'value': u'20'},
                {'id': u'fontstyle', 'name': u'Style', 'value': u'1'}]}