File: XMLBuffer.cpp

package info (click to toggle)
codelite 14.0%2Bdfsg-1
links: PTS, VCS
area: main
in suites: bullseye
size: 112,816 kB
sloc: cpp: 483,662; ansic: 150,144; php: 9,569; lex: 4,186; python: 3,417; yacc: 2,820; sh: 1,147; makefile: 52; xml: 13
file content (166 lines) | stat: -rw-r--r-- 4,257 bytes
parent folder | download | duplicates (6)
#include "XMLBuffer.h"
#include "XMLLexerTokens.h"
#include "macros.h"

wxStringSet_t XMLBuffer::m_emptyTags;

XMLBuffer::XMLBuffer(const wxString& buffer, bool htmlMode)
    : m_buffer(buffer)
    , m_state(kNormal)
    , m_htmlMode(htmlMode)
{
    m_scanner = ::xmlLexerNew(buffer);
}

XMLBuffer::~XMLBuffer()
{
    if(m_scanner) {
        ::xmlLexerDestroy(&m_scanner);
    }
}

void XMLBuffer::Parse()
{
    m_elements.clear();
    CHECK_PTR_RET(m_scanner);
    XMLLexerToken token;
    m_state = kNormal;
    while(::xmlLexerNext(m_scanner, token)) {
        switch(m_state) {
        case kNormal: {
            switch(token.type) {
            case kXML_T_XML_OPEN_TAG:
                m_state = kNonXmlSection;
                break;
            case kXML_T_CDATA_START:
                m_state = kCdata;
                break;
            case kXML_T_COMMENT_START:
                m_state = kComment;
                break;
            case '<':
                // "<" was found
                OnOpenTag();
                break;
            case '>':
                // ">" was found. If in HTML mode and the current scope is an open tag
                // pop it
                OnCloseTag();
                break;
            case kXML_T_CLOSE_TAG_PREFIX:
                // "</" was found
                OnTagClosePrefix();
                break;
            case kXML_T_CLOSE_TAG_SUFFIX:
                // "/>" closing tag was found
                if(!m_elements.empty()) m_elements.pop_back();
                break;
            default:
                break;
            }
        } break;
        case kCdata: {
            switch(token.type) {
            case kXML_T_CDATA_END:
                m_state = kNormal;
                break;
            default:
                break;
            }
        } break;
        case kComment: {
            switch(token.type) {
            case kXML_T_COMMENT_END:
                m_state = kNormal;
                break;
            default:
                break;
            }
        } break;
        case kNonXmlSection: {
            switch(token.type) {
            case kXML_T_XML_CLOSE_TAG:
                m_state = kNormal;
                break;
            default:
                break;
            }
        } break;
        }
    }
}

void XMLBuffer::OnOpenTag()
{
    XMLLexerToken token;
    if(!::xmlLexerNext(m_scanner, token)) return;
    if(token.type == kXML_T_IDENTIFIER) {
        // in html mode and found an empty tag?
        XMLBuffer::Scope scope;
        scope.line = token.lineNumber;
        scope.tag = token.text;
        scope.isEmptyTag = (m_htmlMode && IsEmptyHtmlTag(token.text));
        m_elements.push_back(scope);
    }
}

void XMLBuffer::OnTagClosePrefix()
{
    XMLLexerToken token;
    if(!::xmlLexerNext(m_scanner, token)) return;
    if(token.type == kXML_T_IDENTIFIER) {
        if(!m_elements.empty()) {
            m_elements.pop_back();
        }
    }
}

XMLBuffer::Scope XMLBuffer::GetCurrentScope() const
{
    if(m_elements.empty()) return XMLBuffer::Scope();
    return m_elements.back();
}

bool XMLBuffer::ConsumeUntil(int until)
{
    XMLLexerToken token;
    while(::xmlLexerNext(m_scanner, token)) {
        if(token.type == until) return true;
    }
    return false;
}

bool XMLBuffer::IsEmptyHtmlTag(const wxString& tag)
{
    if(m_emptyTags.empty()) {
        m_emptyTags.insert("br");
        m_emptyTags.insert("hr");
        m_emptyTags.insert("meta");
        m_emptyTags.insert("link");
        m_emptyTags.insert("base");
        m_emptyTags.insert("img");
        m_emptyTags.insert("embed");
        m_emptyTags.insert("param");
        m_emptyTags.insert("area");
        m_emptyTags.insert("col");
        m_emptyTags.insert("input");
        m_emptyTags.insert("isindex");
        m_emptyTags.insert("basefont");
        m_emptyTags.insert("!doctype");
    }
    wxString tagName = tag.Lower();
    if(tagName.StartsWith("<")) {
        tagName.Remove(0, 1);
    }
    return m_emptyTags.count(tagName);
}

void XMLBuffer::OnCloseTag()
{
    if(!m_elements.empty()) {
        XMLBuffer::Scope& curscope = m_elements.back();
        if(curscope.isEmptyTag) {
            m_elements.pop_back();
        }
    }
}