Os fluxos de informação são hoje altamente dependentes da tecnologia da informação. A tecnologia é uma variável das mais importantes a proporcionar conjuntos relevantes de transformações nas empresas contemporâneas. Há uma aceleração do processo de geração de inovações as quais, por sua vez, tem raízes no processo de geração de informação e conhecimento e a tecnologia pode ser considerada um lastro desse processo. Tecnologia da informação é também um instrumento poderoso na viabilização de novas estratégias empresariais.
Conforme afirmam NADLER et alli (1994):
"a tecnologia da informação começou a revolucionar o projeto organizacional ao proporcionar alternativas à hierarquia como meio principal de coordenação. Sistemas de informação, arquiteturas comuns, bancos de dados compartilhados, ferramentas de apoio às decisões e sistemas especialistas facilitam a coordenação do comportamento sem controle por meio da hierarquia, permitindo com isso a criação de unidades autônomas ligadas pela informação. Também permitem um acoplamento menos rígido (em oposição ao acoplamento rígido) sem os riscos de perda de coordenação e controle. A combinação do grande potencial de tecnologia da informação com as grandes exigências do ambiente competitivo levou a inovações no projeto organizacional (NADLER et alli, 1994)"
A tecnologia da informação nas empresas começou a ser utilizada nos anos 60 para melhorar o desempenho de tarefas básicas automatizando rotinas como as de contabilidade e folha de pagamento de pessoal. A partir de então, muitas aplicações para problemas de todas as ordens estão sendo alvo do esforço computacional em aplicações chamadas operacionais - ou seja - problemas do dia-a-dia das empresas. Com o tempo, os sistemas de informação começam a trabalhar integrados uns aos outros, de forma que uma ação em um sistema de informação tem reflexos em outros sistemas e esse ambiente recebe o nome de transacional.[1] Transações são eventos vinculados nos sistemas de informação. Por exemplo, uma venda registrada no sistema de vendas, tem um reflexo no sistema de estoques.
Entretanto, o ambiente estratégico, ou de tomada de decisão, sobretudo nos níveis gerenciais não evolui adequadamente até o final dos anos 70. As organizações estavam bastante informatizadas, mas não possuíam com facilidade informações estratégicas e/ou decisórias em tempo hábil.
A tecnologia da informação inclui um conjunto de elementos que viabilizam a captura, armazenagem, organização e tratamento dos dados de uma organização de forma a transformá-los em informações úteis para uma organização. Inclui também todos os processos de recuperação e disponibilização dessas informações para o seu destinatário ou interessado final. De acordo com os estudos do Prof. André Moreira Pinto, consultor da Diferencial, esses elementos são de três naturezas:
Por informações estratégicas ou decisórias entendemos aquelas informações que não estão diretamente vinculadas a uma atividade operacional da organização e que tem por finalidade subsidiar o posicionamento ou a escolha organizacional em decisões importantes. São, portanto, informações das quais sobremaneira emergem o conhecimento necessário para definições estratégicas, geração de inovações e mudanças em rumos, processos e produtos da organização. De acordo com os estudos realizados pela Diferencial, tais informações podem ser, por exemplo, indicadores sobre nível de satisfação dos clientes, históricos sobre comportamento de vendas de grupos de produtos por região e segmentadas por cliente ou tipo de cliente, informações sobre o comportamento de variáveis financeiras como custos diretos e indiretos por processo ou produto, comportamento de mercados dentre outros. Tais informações se distinguem do que podemos chamar de informações operacionais, ou do "dia-a-dia", como por exemplo o registro contábil de uma transação de venda a cliente ou compra de fornecedor, muito embora essa informação operacional possa ser "embutida" na informação estratégica ou decisória, ou seja: para se chegar a uma informação estratégica sobre comportamento de vendas numa região, por exemplo, foi preciso considerar uma base de dados que registrou as transações de vendas em diversos períodos e diversas regiões. Por isso é importante a adoção de metodologias que possam viabilizar a identificação, desenho e extração do que chamamos de informação estratégica ou decisória das bases de dados das organizações, informações essas que, do nosso ponto de vista, se constituem num dos elementos motores da geração de conhecimentos que interessam a uma organização. É por essa razão que voltamos nossa atenção para Fatores Chave de Sucesso (FCS’s) e Balanced Scorecard (BSC), duas abordagens que selecionamos e consideramos relevantes nessa perspectiva no ambiente contemporâneo.
2.1 A Diferencial Consultores Associados avalia o método dos Fatores Chave de Sucesso
Conforme descreve FURLAN (1997), os FCS’s descrevem aquelas poucas coisas que devem ocorrer de modo correto, mesmo em detrimento de outras que não estejam indo a contento. Esse autor também descreve a origem dessa abordagem:
"Fator Chave de Sucesso é uma teoria lançada como resultado da pesquisa pioneira de John F. Rockart do MIT - Massachusetts Institue of Technology em 1979. Desde então seu uso tem sido verificado em uma infinidade de projetos em todo o mundo como parte da metodologia de planejamento estratégico. A base dos estudos desenvolvidos pelos pesquisadores do MIT foi o principal executivo da organização; no entanto, estudos subseqüentes demonstraram que os fatores chaves de sucesso podem ser úteis para o nível intermediário de decisão, responsável por uma ou mais áreas funcionais. Os FCS’s, se satisfatoriamente atendidos, garantem o desempenho competitivo da organização, mesmo se outros fatores menos relevantes forem negligenciados. Conseqüentemente, tais fatores deveriam receber cuidadosa atenção por parte da gerência executiva. A situação atual pode ser continuamente monitorada através da análise dos indicadores de desempenho. Poderíamos dizer que os fatores chaves de sucesso apresentam uma visão estratégica que considera não apenas o momento atual mas, principalmente, aspectos mais permanentes e abrangentes do negócio. (FURLAN, 1997: 12-15)".
A aplicação do método implica na identificação dos fatores chave, a partir dos objetivos da organização, e de indicadores de performance que permitem monitorar esses fatores chave. Esses indicadores são sustentados por sistemas que geram a informação que lhes corresponde. De acordo com um exemplo, desenvolvido pela Diferencial Consultores Associados, numa empresa podemos ter, dentre outros, os seguintes fatores chave de sucesso e os correspondentes indicadores:
2.2 A Diferencial Consultores avalia o Balanced Scorecard
Em termos de metodologias de planejamento de sistemas de tratamento da informação estratégica, surge na década de 90 o Balanced Scorecard, cuja idéia central é viabilizar mais concretamente a ação estratégica. Pode-se tentar buscar visões que procuram conciliar aspectos das "duas escolas" de pensamento supra citadas. KAPLAN e NORTON (1997) irão apresentar a metodologia BSC - Balanced Scorecard.- ou Marcador Balanceado e que é definido para cada empresa de acordo com sua estratégia, constituindo um instrumento para gerenciar sua implantação. Na visão destes autores:
"O BSC traduz a missão e a estratégia das empresas num conjunto abrangente de medidas de desempenho que serve de base para um sistema de medição e gestão estratégica. O BSC continua enfatizando a busca de objetivos financeiros, mas também inclui os vetores de desempenho destes objetivos. O scorecard mede o desempenho organizacional sob quatro perspectivas equilibradas: financeira, do cliente, dos processos internos da empresa e do aprendizado e crescimento. O BSC permite que as empresas acompanhem o desempenho financeiro, monitorando ao mesmo tempo o progresso na construção de capacidades e na aquisição dos ativos intangíveis necessários para o crescimento futuro (KAPLAN e NORTON, 1997: 2)".
Conforme avaliação da Diferencial, o "Balanced Scorecard" pode ser considerado como uma metodologia de planejamento e definição de sistema de informação estratégica na medida em que procura apresentar uma série de conceitos e uma estrutura de organização dessa informação para medir o desempenho organizacional e subsidiar a tomada de posição da organização. É claro que, visto numa perspectiva mais ampla, não se reduz a metodologia, mas sua aplicação em conexão com sistemas de informação orienta o uso da tecnologia da informação e faz com que seu uso seja direcionado por sua perspectiva no desenho de sistemas.
Realmente, o desempenho de um negócio não pode ser medido em uma única dimensão. Por exemplo, o lucro de uma empresa é um aspecto importante do seu desempenho, mas sozinho não indica que a empresa está bem ou mal. KAPLAN E NORTON (1997) desenvolveram o sistema de medição supracitado, conforme apresentado na Figura 1.

Figura 1: O Balanced Scorecard fornece a estrutura necessária para a tradução da estratégia em termos operacionais.
Em cada uma dessas dimensões , são usados vários indicadores, relacionados às estratégias da organização. As quatro dimensões do desempenho compreendem:
De acordo com o Prof. André Moreira Pinto, consultor da Diferencial, um aspecto muito importante para a tecnologia da informação foi o surgimento e crescente utilização de bancos de dados e de seus sistemas gerenciadores de bancos de dados - os SGBD’s, que consistem em uma coleção de dados inter-relacionados e um em um conjunto de programas para acessá-los. Conforme afirma KORTH & SILBERSCHATZ (1995) os sistemas de bancos de dados são projetados para gerenciar grupos de dados que serão a matéria prima da informação (Figura 2). Eles fornecem segurança contra falhas, evitam redundância e inconsistência, garantem um armazenamento mais adequado, melhoram o acesso aos dados e solucionam problemas de integridade. [2] O uso de bancos de dados cresceu nas últimas décadas, uma vez que as estruturas de dados por eles armazenadas podiam ser utilizadas várias vezes em muitos sistemas diferentes, e isso ficou ainda mais ressaltado com a utilização crescente do modelo relacional de dados. No modelo relacional, o SGBD administra a integração de tabelas de dados entre si que podem ter os mais diversos arranjos.

Figura 2: Os bancos de dados armazenam dados e alimentam os sistemas de informação
A partir do final dos anos 70, ferramentas de software para apoio a decisão gerencial começam a se popularizar no ambiente organizacional. No que tange a softwares, em meados dos anos 80, a tecnologia dos Sistemas de Informação Executiva (os Executive Information Systems - EIS, softwares desenvolvidos especificamente para o processo de tomada de decisão gerencial e baseados em Fatores Chave de Sucesso) começou a produzir mudanças significativas no processo de gestão da informação estratégica nas organizações. No final dos anos 90, começam a surgir softwares baseados na visão do BSC.
3.1 Enterprise Resources Planning
Conforme estudos da Diferencial, na verdade hoje, tanto o ambiente de informação transacional, quanto o gerencial mudaram significativamente. No campo dos sistemas transacionais, o final dos anos 90 assiste ao crescimento dos chamados softwares de gestão integrada, os ERP’s - Enterprise Resources Planning. O conceito de ERP’s consiste na integração da empresa como um todo em uma única plataforma de software, com módulos "plug in" dedicados a cada função, como compras, vendas e produção. O ERP demanda e promove a criação de uma grande base de dados corporativa nas organizações. Conforme afirma CORRÊA, et alli (1999):
"A tendência parece claramente indicar que as estruturas dos ERP’s serão utilizadas pelas empresas como as fundações (a grande base de dados corporativa para apoio à tomada de decisão, principalmente operacional) dos sistemas de informação das empresas (CORRÊA, et alli, 1999:344)".
Entretanto, os ERP’s ainda enfrentam muitos problemas de implantação e precisam ainda de um esforço estratégico mais denso para definição de seu verdadeiro papel nas organizações. Focam mais aspectos da operação do que da gestão organizacional propriamente dita.
No campo do tratamento tecnológico da informação decisória ou estratégica (já definida no item 2), nos níveis gerenciais e técnicos mais altos na estrutura das organizações, a tecnologia evolui nos anos 90 para o conceito de data warehousing, forçada por suas crescentes necessidades de conhecimento.
Para a Diferencial, Data warehousing é um ambiente de transformação dos dados em informação, através de metodologia específica e utilização de ferramentas de extração, manipulação e exploração. É uma conjunção de diferentes tecnologias como bancos de dados cliente/servidor, interfaces gráficas, computadores com alto poder de processamento e/ou processamento paralelo, sistemas operacionais de rede, discos rígidos com grande capacidade de armazenamento e velocidade acesso, OLAP (On Line Analytical Processing), etc. tornando viável o melhor uso de informações geradas nos diversos sistemas transacionais, no ERP, ou obtidas externamente. O ponto central é a idéia de "armazém de informações", ou data warehouse, uma base específica para informações relevantes ou estratégicas para a organização [3]. Vários termos técnicos, que serão gradativavente abordados ao longo desse capítulo, surgiram associados a esse, ganhando espaço e interesse nas organizações, tais como OLAP, Data Mining, Modelagem Dimensional, dentre outros. Portanto, Data warehousing é um processo que é suportado por um número de diferentes produtos de tecnologia e serviços profissionais de tecnologia de informação, para os quais a Diferencial Consultores Associados tem plenas respostas.
Conforme INMON (1996) [4] um Data warehouse é uma área de armazenamento de informação para suporte a decisão, ou, num sentido mais amplo, de informação geradora de conhecimento sobre performance, resultados, produtos, mercados, ou quaisquer variáveis consideradas estratégicas. Ele coleta dados a partir de diversas aplicações em um sistema operacional de uma organização, integra os dados em áreas lógicas de assuntos dos negócios, armazena a informação de forma que ela fique acessível e compreensível a pessoas não técnicas responsáveis por tomadas de decisões e entrega informação aos tomadores de decisão através da organização e definição de várias ferramentas de relatório e busca, melhor discutidas no item 4.5. Na perspectiva desse autor
Então, por data warehouse podemos entender uma modalidade de implementação de base de dados informacional computadorizada voltada ao armazenamento de dados compartilháveis, obtidos a partir dos ambientes de base de dados operacionais. Trata-se de uma base de dados temática, ou por assuntos, que permite aos usuários penetrar o vasto repositório de dados operacionais de uma corporação para subsidiar mais eficazmente um processo decisório e/ou fazer frente às tendências de negócios, facilitando esforços de planejamento. Essa é a perspectiva adota pela Diferencial Consultores no desenvolvimento de seus projetos junto a clientes.
Seu princípio fundamental afirma que as bases de dados nos sistemas de suporte à decisão ou qualquer sistema que trate informações estratégicas e mais refinadas, devem ser isolados dos sistemas transacionais. Tais bases devem desenhadas especificamente para finalidades estratégicas e de tomada de decisão. Assim, podem ser alimentadas pelos sistemas transacionais - mas não utilizadas por eles - e seu desenho deve privilegiar o desempenho das consultas. É uma tecnologia de armazenamento estratégico de informação e que vem ganhando cada vez mais espaço dentro das organizações e que pode ser utilizada na construção de bases de dados de conhecimento coletivo.
Essa base de dados é implementada com uma abordagem diferente dos bancos de dados relacionais, cujo princípio fundamental era o relacionamento ente múltiplas tabelas entre si [5]. No data warehouse a modelagem de dados é chamada de multidimensional, ou seja: ao invés de considerar tabelas, considera dimensões de informação.
4.1 Avaliação da Diferencial Consultores sobre a Modelagem Multidimensional
Em sua obra clássica sobre o assunto, KIMBALL (1996) afirmará:
"Modelagem dimensional é um nome novo para uma técnica antiga usada para criar bancos de dados simples e compreensíveis. Quando um banco de dados pode ser visualizado como um "cubo" contendo três, quatro, ou até cinco ou mais dimensões, as pessoas conseguem fatiar esse cubo em qualquer de suas dimensões. (...) Experimentemos um exemplo simples. Imagine um negócio em que o CEO descreva as atividades da empresa da seguinte forma: "vendemos Produtos em vários Mercados e avaliamos nosso desempenho ao longo do Tempo". Muitas pessoas consideram fácil imaginar esse negócio como um cubo de dados, com legendas em cada uma das arestas do cubo, como mostra a Figura 3. Qualquer ponto no interior do cubo está na interseção das coordenadas definidas pelas arestas do cubo. Para o exemplo citado, legendamos as margens do cubo como Produto, Mercado e Tempo ( KIMBALL, 1996:Introdução p. xviii)".
A Figura 3, adaptada da obra de THOMSEN (1997) e de KIMBALL (1996) apresenta a idéia desses autores sobre modelo muldimensional e o processamento analítico em tempo real (On Line Analytical Processing - OLAP). Nessa figura, por mercado entenda-se a região na qual o mesmo se encontra subdividido. Conforme lembra esse autor, Isso permite que os dados sejam separados e combinados usando-se qualquer medição possível do negócio.

Figura 3: O modelo multidmensional de um negócio: cada ponto do cubo contém as medições para a combinação específica de produto, mercado e região.
Entretanto, como a maioria dos bancos de dados nas organizações é relacional, a implementação de sistemas de informação com base nessa abordagem tornou-se bastante complexa.
Realmente, a maioria dos sistemas está no ambiente transacional, chamado de OLTP - Online Transaction Processing (processamento de transações on-line) responsável por registrar e manipular dados de transações cotidianas de uma organização. Uma transação é um evento completo com uma ou múltiplas seqüências relacionadas. Por exemplo, uma compra em um supermercado terá vários impactos nos sistemas e bancos de dados: registro no sistema de faturamento, registro de retirada em estoque e contabilização. É nesse ambiente que se encontram todos os sistemas e aplicações voltados para o dia-a-dia operacional da empresa. Esse ambiente lida com dados excessivamente detalhados, isto é, organizados por transação e por isso é inadequado aos sistemas de apoio a decisão.
Novamente KIMBALL (1996) aponta:
"a despeito de todas essas diferenças, continuamos a usar os princípios e ferramentas OLTP para projetar nossos bancos de dados de data warehouse. (...) As técnicas e padrões de projeto apropriados para o processamento de transações são inadequadas e até mesmo destrutivo para "projetos de data warehouse"( KIMBALL, 1996: Cap1)".
A questão se apóia basicamente na modelagem de bancos de dados relacionais, até então realizada no chamado modelo de entidade-relacionamento e voltada para o ambiente OLTP. Mas o problema vem sendo solucionado não tanto com novos softwares de gerenciamento de bancos de dados, mas com artifícios metodológicos para modelagem de dados. Como a grande maioria das organizações possuem grandes bases de dados operacionais modeladas segundo no ambiente relacional, urgia criar-se uma abordagem metodológica que viabilizasse a idéia da modelagem por dimensões usando porém o próprio SGBD relacional existente numa determinada organização.
Para viabilizar tecnicamente a nova abordagem de modelagem de dados, ou seja, o modelo multidimensional surgem os modelos ou arranjos lógicos específicos, como o "Modelo Estrela" (ou Star Schema / Star Model, aqui diferente do conceito apresentado no capítulo 2 desenvolvido por Jay Galbraith) e que descreveremos sucintamente.
O modelo estrela assume que existem apenas dois tipos de tabelas: as de dimensão e de fatos. De acordo com NETO (1998), "o diagrama estrela é o principal tipo de modelo multidimensional. Nele, há uma tabela central, dominante, com muitas junções, conectando-se a outras tabelas, as tabelas de dimensão, as quais possuem apenas uma junção com a tabela central". As tabelas de fato tem característica agregadora promovendo a articulação das dimensões. As tabelas de dimensão não podem relacionar-se entre si, mas apenas com a tabela de fatos. Uma tabela de fatos armazena medições numéricas do negócio. Cada uma das medições é obtida com a interseção de todas as dimensões. A Figura 4 detalha um exemplo que começou a ser discutido na Figura 3, na apresentação da modelagem multidimensional.

Figura 4: Modelagem Muldimensional de Dados Para o Processo Decisório no Modelo Estrela -
O modelo apresentado acima tem grande poder de visualização de informações quando comparado com o modelo relacional. Evita redundância de dados e campos de tabelas e promove uma melhor capacidade de percepção e agregação de informações. Podemos aplicar esse modelo num exemplo de um atacadista que comercializa produtos agrícolas e constatar que ele facilita a análise dos dados. É possível fazer uma comparação entre como os dados que podem ser obtidos pela aplicação do modelo relacional, de uso tradicional nas organizações, é diferente do modelo multimensional no arranjo estrela (star schema ou star model), utilizado na modelagem do data warehouse e em softwares baseados em OLAP (que promovem o processamento analítico em tempo real). Analisando a Figura 5 é possível observar que o exemplo do segundo quadro apresenta um nível mais sofisticado e preciso de tratamento dos dados e obtenção de informação, com impacto para a obtenção da informação estratégica e gerencial, bem como para a gestão do conhecimento organizacional.
| PRODUTO | REGIÃO | VENDAS NO TEMPO |
|---|---|---|
| ARROZ | MINAS GERAIS | 6 |
| ARROZ | SÃO PAULO | 5 |
| ARROZ | GOIÁS | 4 |
| SOJA | MINAS GERAIS | 3 |
| SOJA | SÃO PAULO | 5 |
| SOJA | GOIÁS | 5 |
| MILHO | MINAS GERAIS | 4 |
| MILHO | SÃO PAULO | 3 |
| MILHO | GOIÁS | 2 |
| PRODUTO | M. GERAIS | SÃO PAULO | GOIÁS | TOTAL |
|---|---|---|---|---|
| ARROZ | 6 | 5 | 4 | 15 |
| SOJA | 3 | 5 | 5 | 13 |
| MILHO | 4 | 3 | 2 | 9 |
| TOTAL | 13 | 13 | 11 | 37 |
| Figura 5: Comparativo entre modelagem relacional e multimensional |
|---|
O conceito de data warehouse vem sendo implementado nas organizações em três modalidades de bases de dados:
Data Warehouse (propriamente dito): grande base de dados desenhada, consolidada e organizada por assuntos para fins gerenciais, contendo dados históricos para tomada de decisão.
Data Mart: data warehouse ou banco de dados de menor porte, isto é, uma base consolidada, porém com desenho mais simples e de caráter departamental, com dados históricos e analíticos voltados para decisões.
Operational Data Store (ODS): base de dados intermediária entre sistemas transacionais e bases gerenciais. Possui utilização previsível, é parcialmente estruturada e analítica com dados relacionais, voláteis ou correntes, contendo, muitas vezes, dados atualizados em tempo real. Mescla dados operacionais com dados para tomada de decisão ou dados estratégicos.
Além da definição de bases de dados, o ambiente data warehousing leva em consideração a questão do tratamento e extração da informação que trataremos no próximo item.
A Diferencial Consultores Associados é uma empresa habilitada a conduzir projetos em Gestão do Conhecimento. O conhecimento organizacional está muitas vezes "enterrado" nos bancos de dados da organização. Por extração de conhecimentos em bases de dados entendemos o processo de utilização de diversas tecnologias integradas que nos permitem armazenar, tratar e recuperar informações estratégicas que orientam o comportamento das pessoas, o posicionamento estratégico e a tomada de decisão nas organizações. A partir do exposto até o presente, podemos sintetizar alguns conceitos e introduzir outros que nos permita viabilizar sua relação com geração de informação e conhecimento.
5.1 Síntese de Conceitos de Tecnologia
Conforme apresentamos no item anterior, Data Warehousing é uma abordagem tecnológica de crescente interesse que combina computação inteligente, base de dados e "aprendizagem" de máquina. É o processo como um todo que identifica e organiza os dados, a infraestrutura tecnológica e as ferramentas de extração e descoberta das informações valorosas para a tomada de decisão em grandes coleções de dados. Esse processo total engloba uma série de alternativas (não excludentes e muitas vezes complementares entre si) cujos conceitos básicos muito utilizados atualmente nas áreas de Tecnologia da Informação nas organizações levam em conta as bases de dados e os processos e mecanismos de tratamento e extração de dados. Uma síntese elaborada pelo Prof. André Moreira Pinto, MSC, da Diferencial, sobre os conceitos associados a data warehousing é apresentado a seguir e os mesmos estão associados a bases de dados e ferramentas de extração.
5.1.1 Bases de Dados
Os conceitos de bases de dados foram explicitados no final do item 4.
5.1.2 Processos e Ferramentas de Tratamento, Extração e Apresentação de Dados
Os processo de extração, tratamento e apresentação de dados pode ser hoje caracterizado pelas tecnologias OLAP e EIS, além de Data Mining, abordado no próximo tópico dessa dissertação.
OLAP: On Line Analytical Processing tecnologia para processamento analítico em tempo real e que se serve da implementação do modelo multidimensional para organização e apresentação dos dados, extraídos dos data warehouse e visualizados numa perspectiva de "cubo", isto é, combinando várias dimensões de informação como apresentado na Figura 3. Há hoje ferramentas de software disponíveis no mercado e que operam nessa perspectiva.
EIS: Executive Information System: tipo de ferramenta que formata as principais consultas realizadas por executivos facilitando a organização e consolidação de informações já conhecidas pelos tomadores de decisão. Pode incluir hoje recursos de OLAP e inteligência artificial e funciona "alimentado" por um Data Mart ou Data Warehouse.
5.2 Data Mining: Sistemas "Inteligentes" Prospectando Dados
É importante salientar que além do EIS e da modelagem multidimensional utilizada para modelagem de data warehouses e no OLAP, outro recurso de prospecção em bases de dados é o data mining ou "sistemas inteligentes". Essa é outra área de atuação da Diferencial: o desenvolvimento de aplicções no contexto data mining .Contamos com profissionais habilitados em técnicas da inteligência artificial, tais como fuzzy logic e neural networks. De acordo com o Prof. André Moreira Pinto, consultor da Diferencial, analisando a obra de WESTPHAL e BLAXTON (1998), podemos dizer que Data Mining é um termo que pode ser considerado uma como ferramenta (software) "inteligente" (que se serve de algum recurso da chamada inteligência artificial) e que viabiliza a busca de dados em bases de uma empresa, procurando descobrir informações desconhecidas pelos tomadores de decisão. É uma ferramenta de sistema propriamente dita que atua na descoberta de informações e "conhecimento" através dos dados (base de dados), centralizando-se na descoberta automática de novos fatos e relações nos dados [6]. Podemos dizer a priori que o data mining se serve de algumas abordagens de sistemas inteligentes para cumprir seus objetivos.
A aplicação de um instrumento de data mining, tecnologia dominada pela Diferencial, possui três passos:
Para a Diferencial, a moderna denominação de Sistemas Inteligentes, expressão que inclui os softwares concebidos na perspectiva de data mining, engloba uma série de estratégias tecnológicas e desenho de sistemas que são adequados à solução de problemas complexos envolvendo o tratamento sofisticado de dados para tomada de decisões. Modelos matemáticos de programação linear, simulações e abordagens heurísticas estão inseridas nessa perspectiva.
Dentre as estratégias tecnológicas emergentes que são utilizadas no desenvolvimento de sistemas inteligentes para data mining. Podemos citar [7] as seguintes, com um sumário de sua descrição [8]:
O objetivo principal de um algoritmo genético é o de evoluir a partir de uma população de soluções para um determinado problema, tentando produzir novas gerações de soluções que sejam melhores que as anteriores. Esses algoritmos operam através de um ciclo simples que consiste dos seguintes passos: criação da população inicial, avaliação, seleção e reprodução, este último envolvendo a recombinação e mutação do material "genético" das soluções.
Uma das principais potencialidades da lógica nebulosa, quando comparada com outros esquemas que tratam com dados imprecisos como redes neurais, é que suas bases de conhecimento, as quais estão no formato de regras de produção, são fáceis de examinar e entender. Este formato de regra também torna fácil a manutenção e a atualização da base de conhecimento.
Redes neurais são compostas por diversas unidades computacionais paralelas interconectadas. Cada uma dessas unidades efetua um pequeno número de operações simples e transmite seus resultados às unidades vizinhas. As redes neurais aprendem a reconhecer padrões através de um processo de treinamento baseado em vários exemplos diferentes. Elas são eficientes no reconhecimento de padrões em um conjunto de dados, quer estes representem imagens digitalizadas ou o comportamento de uma moeda no mercado de câmbio.
Redes neurais também são bastante efetivas no aprendizado de padrões a partir de dados não-lineares, incompletos, com ruídos e até compostos de exemplos contraditórios. A habilidade de manipular estes dados imprecisos faz com que as redes neurais sejam extremamente eficazes no processamento de informações financeiras e em tarefas onde especialistas não estão à disposição ou um conjunto de regras claras não pode ser facilmente formulado. As redes neurais não são, portanto, apropriadas para as aplicações em que a explicação do raciocínio é fundamental.
Defensores de ambos, processamento simbólico e adaptativo, argumentam que suas técnicas isoladamente são as mais adequadas para modelar e resolver problemas complexos do mundo real. Um exame em detalhe destas classes de processamento e suas aplicações revela, no entanto, que ambos os procedimentos apresentam uma combinação de vantagens e limitações e que a integraçáo de diferentes técnicas pode ajudar a superar seus pontos fracos. Na verdade, muitos dos problemas complexos do mundo real requerem a ação combinada dos procedimentos complementares.
A partir do que foi exposto até o presente momento nesse capítulo, podemos apresentar, na Figura 6, o diagrama que sintetiza o que foi discutido até o presente momento e apresenta uma idéia geral de um possível processo de geração de informação decisória ou estratégica: sistemas transacionais alimentam data warehouse que, por sua vez, é base de dados corporativa para consulta de sistemas inteligentes, data mining e executive information system. Ela sintetiza o potencial de atuação da Diferencial Consultores Associados. Esses sistemas tem características gerenciais, apoiando o processo decisório nas organizações e contribuindo para melhor performances do conjunto dos sistemas de informação na organização.

Figura 6: Articulação de Tecnologias para Geração de Informações e Conhecimento
À Figura 6 falta agregar um último elemento tecnológico: a computação colaborativa que trataremos a seguir.
Conforme a experiência e estudos da Diferencial, a integração de pessoas e organizações através de computadores é um processo que vem se aprofundando nos últimos anos e ganhou novo impulso pelo crescimento do uso da Internet. Nas empresas, além da Internet, que tem uso crescente, o modelo computacional cliente-servidor também fornece sua parcela de contribuição para ampliação do uso de computadores pelas pessoas. Os sistemas computadorizados podem também viabilizar o trabalho colaborativo. A idéia de groupware ganha impulso na medida em que cria novas perspectivas de relacionamento e trabalho dentro das empresas.
De acordo com BARTHELMESS (1996):
"a área de CSCW compreende todo o software que tem por objetivo prestar auxílio ao trabalho cooperativo. É justamente este o fator que torna este tipo de software diferente dos demais.
A noção de que este tipo de software deve mediar a interação de diversas pessoas que buscam obter um objetivo comum introduz novos requisitos normalmente não encontrados em outros sistemas. Se enfatiza a interação entre usuários e não mais a interação sistema/usuário, como acontece na maioria dos sistemas (que passaremos a chamar de convencionais, em contraposição a esta nova classe de software cooperativo ou groupware).
A ubiqüidade de estações individuais de trabalho, ligadas por redes, cria uma oportunidade tecnológica de se prover suporte às atividades de grupos de trabalho nas organizações . O padrão de utilização dos computadores migrou de uma centralização representada pelas máquinas de grande porte nos CPDs para um de utilização individual, em que cada usuário ou grupo de usuários possui suas ferramentas, como planilhas e editores, trabalhando normalmente em isolamento. Estas atividades isoladas não correspondem, porém, à real necessidade das organizações, nas quais o trabalho não é realizado costumeiramente por apenas um indivíduo, mas é fruto de um esforço coletivo.
Diversas categorias de produtos procuram explorar esta nova oportunidade, geralmente em áreas específicas, como por exemplo os da lista abaixo, que está longe de ser exaustiva:
Editores e planilhas para uso em grupo;
Vídeo-conferência;
Bulletin-Board Systems;
Correio eletrônico;
Sistemas de Workflow (BARTHELMESS,1996: Cap 1)".
Merecem destaque no contexto do groupware o correio eletrônico e o workflow. O correio eletrônico é um recurso mais antigo que já se encontrava presente em ambientes de computação centralizada com uso de mainframes, mas é com a Internet e uso de ambiente cliente-servidor que ganhará uma maior e mais profunda amplitude de uso nas organizações. A troca de mensagens eletrônicas evolui gradativamente para o conceito de workflow, ou fluxo de trabalho computadorizado, isto é, a incorporação de rotinas e processos encadeados de trabalho por softwares em computadores ligados em rede.
Ainda de acordo com BARTHELMESS (1996),
Sistemas de workflow podem ser definidos como sistemas cujo objetivo é "auxiliar as organizações na especificação, execução, monitoramento e coordenação do fluxo de trabalho em um ambiente de escritório distribuído".
Software especificamente desenvolvido para possibilitar a criação de sistemas de gerenciamentos e de compartilhamento de informações por multi-usuários, possibilitando a consulta em rede em tempo real. Este sistema pode ser moldado de acordo com as necessidades de cada empresa.
O fluxo de trabalho corresponde à tramitação de documentos e informações entre diversos agentes, pertencentes a unidades organizacionais potencialmente distintas, cada qual agregando uma parcela do trabalho necessário para que se alcance determinado objetivo de negócio.
A observação de que por volta de 90% desta tramitação pode ser considerada rotineira e repetitiva torna natural que se deseje suprir suporte automatizado para estas tarefas. Após um surto de interesse nos anos 70, associado à área de automação de escritórios, a pesquisa relativa a sistemas de workflow ficou estagnada durante a maior parte dos anos 80, devido ao fracasso dos sistemas pioneiros. Verificou-se que estes sistemas apresentavam uma inflexibilidade que inviabilizava seu uso prático, mesmo em situações simples e controladas (BARTHELMESS, 1996: Cap 2).
Na análise do Prof. André Moreira Pinto, consultor da Diferencial, diante da perspectiva de aumento da produtividade e da flexibilidade nas empresas, a idéia do "teletrabalho" se afirma mais em meados da década de 90. Ressurge, portanto, a pesquisa na área, com o aparecimento de sistemas mais flexíveis, baseados na experiência de seus predecessores de primeira geração. Apesar de bastante melhores, mesmo estes sistemas apresentam limitações de representação e execução que criam uma oportunidade de melhoria. Surgem softwares que integram as funções de correio eletrônico, como o Exchange, da Microsoft e o Lotus Notes, da Lotus. Na visão dos fabricantes, o principal objetivo de softwares de workflow é aumentar a eficiência de processos de negócio e a eficiência das pessoas que trabalham em conjunto para executá-los. As tecnologias para groupware oferecem ferramentas cooperativas como fóruns de discussão, calendários, agendas e um sistema de distribuição de arquivos. Os benefícios em geral ressaltados quando do uso desses recursos são:
Analisando um software voltado para o ambiente de groupware, o Lotus Notes, percebemos que é um sistema de desenvolvimento de aplicações, personalizável e programável, que apresenta uma boa integração com a Internet. O Lotus Notes proporciona às organizações um interessante conjunto de serviços baseados em padrões mais atuais, especialmente para correio eletrônico, grupos de discussão e uso de calendário partilhado.
O Lotus Notes introduz o conceito de ambiente de groupware total, em oposição a um conjunto de funções rigidamente definidas e independentes. As aplicações de groupware do Lotus Notes - desde as aplicações de workflow até às bases de dados de discussão - são construídas dentro desse ambiente utilizando blocos de construção comuns. A capacidade para especificar e desenvolver uma base de dados adequada a uma aplicação particular de uma empresa é essencial para muitos administradores de groupware. No entanto, para instalações mais pequenas, com menores recursos de desenvolvimento, o Notes também oferece um conjunto de modelos de aplicação, incluindo uma visão básica de workflow com aprovação por item, bibliotecas de documentos, um sistema de reserva de espaço e uma base de dados de discussão.
De acordo com o Prof. André Moreira Pinto, MSC, consultor da Diferencial, não obstante as potencialidades e avanços da tecnologia da informação, sua utilização não pode se dar igualmente por todas as organizações. Elaboração de projetos consistentes, necessidade de mão-de-obra muito qualificada para desenvolvimento, implantação e suporte, investimentos em compra de softwares, pagamento de licenças de uso, capacitação de pessoal e infraestrutura física (equipamentos) ainda limitam o uso de muitas soluções de vanguarda em tecnologias de informação, mesmo quando a organização decide sub-contratar (terceirizar) o processo de geração de informação junto a empresas prestadoras de serviços (o que nem sempre é possível, seja por razões estratégicas ou técnicas). Investimentos em ERP e Data Warehousing em geral exigem volumes não desprezíveis de recursos financeiros incompatíveis com o porte ou a situação financeira de muitas organizações. Além disso, é preciso considerar a velocidade com que muitas dessas tecnologias se tornam obsoletas, tanto na área de hardware como de software, representando uma constante pressão nos custos das empresas para constante atualização tecnológica. Além disso, o processo de escolha de qual tecnologia é a mais adequada a determinada organização (projeto), nem sempre é fácil de ser realizado, mesmo por profissionais experientes e dirigentes imbuídos da intenção de otimizar processos produtivos e de gestão organizacional. Um exemplo recente em organizações pode ser o uso da tecnologia ERP em muitas empresas brasileiras e estrangeiras. Tais empresas fizeram opções por essa tecnologia mesmo contrariando suas características básicas de produção de bens ou serviços. Realmente a tecnologia ERP que pretende gerenciar de forma integrada todo o fluxo de informações numa organização muitas vezes não se aplicará, por exemplo, a várias empresas de serviço e alguns tipos de indústria, limitando-se por isso mesmo a integração de informações de funções administrativas de apoio, como compras, contabilidade e finanças [9].
Entretanto, apesar dos desafios e dificuldades, as perspectivas de utilização de novas tecnologias da informação continuam a crescer e muitos problemas podem encontrar novas soluções. Por exemplo, visando reduzir os custos com tecnologia da informação, no Rio Grande do Sul, o Governo do Estado decidiu utilizar softwares de código aberto, desprovidos da obrigatoriedade de pagamento de licença de uso, em vários segmentos da administração pública estadual, com reaproveitamento de computadores que antes foram considerados tecnologicamente defasados. Decisão semelhante foi tomada na Prefeitura de Porto Alegre no governo da França. Governos da Dinamarca, Noruega e China também estudam o assunto [10]. Decisões como essas estão ao alcance de muitas organizações e podem contribuir, em algumas situações, para o aumento da viabilidade do uso da tecnologia da informação nas empresas. Também é preciso considerar que o crescimento da Internet e o conseqüente impulso dado ao que vem sendo chamado de comércio eletrônico está impelindo as empresas a uma maior utilização de tecnologias da informação, não só no ambiente transacional, mas também em atividade de suporte à gestão (data warehousing) e no trabalho colaborativo por computador.
De acordo com GALBRAITH (1993: 35)
"a tecnologia da informação fornecerá alternativas mais eficientes para divulgação do conhecimento. À medida que as companhias acumulam conhecimentos em dados, esses conhecimentos podem ser acessados pelos grupos generalistas em qualquer local da empresa. Quando tais conhecimentos forem combinados com capacidade interativa e inteligência artificial, podem ser acessados pelos grupos encarregados de resolver problemas em qualquer parte. Finalmente, o vídeo permitirá demonstrações ao vivo de projetos e reparos difíceis. "Manuais em vídeo" já estão disponíveis aos representantes de atendimento ao cliente em diversas experiências realizadas pelas empresas. O pessoal de reparos pode acessar texto, voz, imagens "congeladas" para receber os conhecimentos necessários. Os dados periciais da companhia substituirão, cada vez mais, a equipe central especializada. Conhecimentos para atualizar os dados serão comprados fora ou obtidos dos centros de perícia distribuídos pela empresa".
Realmente as afirmações desse autor parecem estar se mostrando verdadeiras no seio de inúmeras organizações. A Ciência da Computação vem desenvolvendo soluções técnicas sofisticadas relativas ao armazenamento e disponibilização de informações que expressam não só a realidade operacional de uma empresa mas também informações estratégicas e voltadas para fins de decisão que expressam uma base de informações especiais que traduzam seu conhecimento acumulado ou base de conhecimento - knowledge database. Nos últimos anos avanços significativos foram dados, por exemplo, com tecnologias tais como, sistemas de suporte à decisão, sistemas de informação executiva e, mais recentemente, avanços maiores expressos pelos data warehouses e as redes neurais, muito utilizadas em data mining. Aliados a metodologias conceituais de tratamento estratégico da informação da informação decisória, como os fatores chave de sucesso e o balanced scorecard, por exemplo, os recursos de sistemas computadorizados estão produzindo relevantes alterações no desenho da arquitetura organizacional e no seu processo decisório. Por sua vez, as transformações proporcionadas pelos ambientes de redes de computadores ampliaram a perspectiva de trabalho colaborativo assistido por computador.
Nenhuma das tecnologias discutidas nesse site pode responder isoladamente aos desafios organizacionais contemporâneos. Entretanto, sua mesclagem em arranjos adequados aos objetivos e estratégias organizacionais podem proporcionar resultados relevantes . Da articulação entre o balanced scorecard com o data warehousing, a computação colaborativa e o ambiente web brota um enorme poder de tratamento da informação, o qual altera arquiteturas organizacionais e é decisivo para gestão do conhecimento.
Desejando maiores informações sobre os assuntos discutidos nesse site, entre em contato com o Prof. André Moreira Pinto, MSC, através do e-mail: andremoreira@difnet.com.br
Notas:
[1] - Uma classificação que divide os sistemas de informação em duas categorias, sistemas de processamento de transações e sistemas de suporte à decisão é proposta por DHAR,V. & STEIN, R. em Seven Methods for Transforming Corporate Data into Business Intelligence. USA, Prentice-Hall, 1997. A primeira categoria visa o registro detalhado das operações e fatos relevantes de todas as atividades de negócio, tendo por ênfase a validade e depuração das bases de dados. A segunda categoria apóia os gestores de negócio no processo de tomada de decisão, considerando uma visão de longo prazo.
[2] - Ver análise detalhada na obra Sistema de Bancos de Dados ( KORTH & SILBERSCHATZ, 1995: Cap. 1)
[3] - Data warehousing e data warehouse são termos que representam realidades diferentes: o primeiro termos representa um conjunto de tecnologias que inclui bases de dados e softwares de tratamento e extração de dados. O segundo termo representa apenas um dos elementos desse conjunto que é a base ou armazém de dados mas que, isoladamente, acaba não tendo muito significado e sentido prático.
[4] - Esse autor é o pioneiro na definição de conceitos nessa área, no início dos anos 90. Ver INMON, William H. Buiding the data warehouse. John Wiley & Sons, Inc. USA, 1996.
[5] - Na grande maioria das organizações contemporâneas, o uso de bancos de dados vem seguindo os princípios do modelo relacional proposto por E.F CODD (1969) e que consiste de múltiplos relacionamentos entre diversas tabelas, criadas através de sistemas gerenciadores de bancos de dados e que se sevem de implementações a partir da técnica da análise de entidades e relacionamentos, a qual não é objeto de estudo direto dessa dissertação. A abordagem multidimensional, aqui especificada, é uma alternativa proposta a essa técnica, para tratar informações gerenciais e estratégicas, mas sem excluí-la completamente, tendo em vista que a maioria das organizações atualmente continua a operar com bancos de dados relacionais.
[6] - Ver também, para uma análise mais acurada sobre Data Mining a obra recente de JIAWEI, H e KAMBER, M. Data Mining: concepts and Tecniques. San Francisco, USA. Simon Frise University, 2001.
[7] - Não é objetivo dessa dissertação aprofundar estudos relativos à inteligência artificial, mas apenas salientar algumas técnicas que realizam um tratamento mais elaborado de dados produzindo informações de alta representatividade para o processo de geração de conhecimento.
[8] - Definições apoiadas na análise da obra de MEYER, M., BABER, R. e PFAFFENBERGER, B. (2000, 436-440).
[9] - Pesquisa da Fundação Getúlio Vargas com 28 empresas (sendo 85% multinacionais), em setembro de 1999, indicou que grande parte do investimento realizado na implantação de sistemas ERP em grandes empresas não tiveram o retorno esperado. 45% delas não tiveram aumento de produtividade, 43% não reduziram ciclos produtivos e 40% não tiveram resultados de melhoria para o consumidor. Segundo a mesma pesquisa, muitas decisões de implantação de softwares ERP são tomadas em um ambiente de emoção, urgência e euforia.
[10] - Tais decisões referem-se, sobretudo ao uso do software do sistema operacional LINUX e alguns de seus aplicativos para uso geral em escritório que são com ele compatíveis, tais como o software alemão Star Office (Sun).