ARB help index

#!/usr/bin/perl use strict; use warnings; sub read_xml($); sub read_xml($) { my ($xml_dir) = @_; my @xml = (); my @sub = (); opendir(DIR,$xml_dir) || die "Failed to read '$xml_dir' (Reason: $!)"; foreach (readdir(DIR)) { if ($_ ne '.' and $_ ne '..') { my $full = $xml_dir.'/'.$_; if (-d $full) { push @sub, $_; } elsif (/\.xml$/o) { push @xml, $_; } } } closedir(DIR); foreach my $sub (@sub) { my @subxml = read_xml($xml_dir.'/'.$sub); foreach (@subxml) { push @xml, $sub.'/'.$_; } } return @xml; } sub print_index(\@) { my ($xml_r) = @_; my $header=< ]> ARB help index

HEADER my $footer=<

FOOTER print $header; foreach my $xml (@$xml_r) { my $hlp = $xml; $hlp =~ s/\.xml$/\.hlp/o; my $link = ' '; print $link."\n"; } print $footer; } sub find_indexed_xmls($$) { my ($index_name,$xml_dir) = @_; my @xml = read_xml($xml_dir); @xml = sort map { if ($_ eq $index_name) { ; } # dont index the index else { $_; } } @xml; return @xml; } my %title_line = (); # key=xml-filename, value=lineno of .. sub parse_titles($\@\%) { my ($xml_dir,$xml_r, $title_r) = @_; foreach my $name (@$xml_r) { my $xml = $xml_dir.'/'.$name; open(FILE,'<'.$xml) || die "can't read '$xml' (Reason: $!)"; my $line; LINE: while (defined($line=<FILE>)) { if ($line =~ /<TITLE>(.*)<\/TITLE>/) { $$title_r{$name} = $1; $title_line{$name} = $.; last LINE; } } close(FILE); if (not defined $$title_r{$name}) { die "$xml:1: Failed to parse title\n "; } } } sub warn_duplicate_titles($\%) { my ($xml_dir,$title_r) = @_; my $hlpdir = $xml_dir; my %seen = (); foreach my $file (keys %$title_r) { my $title = $$title_r{$file}; if (defined $seen{$title}) { my $firstFile = $seen{$title}; my $thisLine = $title_line{$file}; my $firstLine = $title_line{$firstFile}; print STDERR "${xml_dir}/${file}:${thisLine}: Warning: duplicated title '$title' ..\n"; print STDERR "${xml_dir}/${firstFile}:${firstLine}: Warning: .. first seen here.\n"; } else { $seen{$title} = $file; } } } sub generate_index($$) { my ($index_name,$xml_dir) = @_; my @xml = find_indexed_xmls($index_name,$xml_dir); my %title = (); parse_titles($xml_dir,@xml,%title); warn_duplicate_titles($xml_dir,%title); @xml = sort { $title{$a} cmp $title{$b}; } @xml; print_index(@xml); } sub main() { my $args = scalar(@ARGV); if ($args != 2) { die "Usage: generate_index.pl NAME_OF_INDEX.xml XMLDIRECTORY\n "; } my $index_name = $ARGV[0]; my $xml_dir = $ARGV[1]; if (not -d $xml_dir) { die "No such directory '$xml_dir'"; } generate_index($index_name,$xml_dir); } main();