O que veio primeiro, o processo ou os dados usados por esse processo? Eu sei que isso é uma questão de "galinha ou ovo", mas no caso de software, acredito que seja o processo.
Por exemplo, você pode construir seu modelo de dados incrementalmente implementando um único caso de uso de cada vez com apenas persistência na memória (ou qualquer coisa tão fácil de implementar). Quando você perceber que implementou casos de uso suficientes para descrever as entidades básicas, poderá substituir a persistência na memória por um banco de dados real e continuar a refinar o esquema à medida que avança, um caso de uso por vez.
Isso tira o foco do banco de dados e o move para o núcleo do problema: as regras de negócios. Se você começar implementando as regras de negócios, você acabará encontrando (por um processo muito semelhante à Natural Selection, a propósito) quais dados são realmente necessários para a empresa. Se você começar modelando o banco de dados, sem o feedback de que os dados são realmente necessários (ou nesse formato, ou nesse nível de normalização, etc ...), você acabará fazendo muitos ajustes atrasados em o esquema (que pode exigir procedimentos pesados de migração, se o negócio já estiver sendo executado), ou você terá que implementar "soluções alternativas" nas regras de negócios para compensar o modelo de dados fora de sintonia. / p>
TL; DR: O banco de dados depende do negócio - é definido por eles. Você não precisará dos dados, a menos que tenha um processo que opera com ele (um relatório também é um processo). Implemente o processo primeiro e você encontrará os dados necessários. Modele os dados primeiro e você poderá contar quantas suposições estavam erradas quando você modelou pela primeira vez.
Um pouco fora do tópico, mas muito importante: o fluxo de trabalho que eu descrevo é frequentemente usado junto com práticas muito importantes como "A coisa mais simples que poderia funcionar", desenvolvimento orientado a testes e foco em desacoplar sua arquitetura de os detalhes que ficam no seu caminho (dica: banco de dados). Sobre o último, esta palestra resume bem a idéia.